Introduksjon til typer datavisualisering
I den moderne arenaen for big data, med over 2, 5 quintillion byte (1 quintillion byte = 10 18 byte!) Av data som er opprettet hver dag (I følge socialmediatoday.com), er det et døende behov for å lagre dataene. Unødvendig å si at disse dataene er tette og dermed ikke så brukervennlige og blir kontinuerlig fokusert. For å skifte paradigme for lett å forstå omfanget av dataene og for å få nyttige fordeler i virksomheten, må dataene presenteres på en mer intuitiv måte og vil derfor kreve passende diagrammer for å visualisere dem. Det er verktøy og metodologier som er laget for å effektivt skildre dataene, men effektiviteten avhenger for det meste av datatypen og kravet som trengs for å bli skåret ut fra dataene.
Hva er datavisualisering?
Datavisualisering er en metodikk der dataene i råformat blir fremstilt for å få frem betydningen av det. Med bruk av big data har det blitt viktig å bygge en meningsfull måte å vise frem dataene på, slik at datamengden ikke blir overveldende. Delen av skildring av dataene kan brukes til forskjellige formål, for eksempel å finne trender / fellestrekk / mønstre i data, lage modeller for maskinlæring eller kan brukes til en enkel operasjon som aggregering.
Ulike typer datavisualisering
Datavisualiseringen er stort sett klassifisert i 6 forskjellige typer. Selv om datavisualiseringens område vokser stadig, vil det ikke være en overraskelse om antall kategorier øker.
Temporal: Data for denne typen visualisering skal tilfredsstille begge forhold: data som er representert skal være lineære og skal være en dimensjonal. Denne typen visualisering er representert gjennom linjer som kan overlappe hverandre og har også et felles start- og sluttdatapunkt. | ||
Sprede tomter | Bruker prikker for å representere et datapunkt. Det vanligste i dagens verden innen maskinlæring under utforskende dataanalyse. | ![]() |
Kake diagram | Denne typen visualisering inkluderer sirkulær grafikk der lysbuens lengde angir størrelsen. | ![]() |
Polar area diagram | I likhet med kakediagram er Polar-områdediagrammet et sirkulært plott, bortsett fra sektorvinklene, er like i lengde og avstanden til å strekke seg fra midten indikerer størrelsesorden. | ![]() |
Linjediagrammer | I likhet med scatter-plottet er dataene representert av punkter, bortsett fra forbundet med linjer for å opprettholde kontinuitet. | ![]() |
Tidslinjer | På denne måten viser vi en liste over datapunkter i kronologisk rekkefølge. | ![]() |
Tidsseriesekvenser | I tidsserier representerer vi størrelsen på data i en 2-D graf i kronologisk rekkefølge av tidsstempel i data. | ![]() |
Hierarkisk: Disse typer visualiseringer skildrer bestilte grupper i en større gruppe. På enkelt språk er hovedintuisjonen bak disse visualiseringene klyngene kan vises hvis strømmen av klyngene starter fra et enkelt punkt. | ||
Treskjema | I et treskjema er den hierarkiske flyten representert i form av et tre som navnet antyder. Få terminologier for denne representasjonen er:
- Root Node: Opprinnelsespunkt. - Barneknute: Har en forelder ovenfor - Bladknute: Ingen flere barneknuter. | ![]() |
Ringekart / Sunburst Diagram | Trerepresentasjonen i Trediagrammet konverteres til radiell basis. Denne typen hjelper til med å presentere treet i en kortfattet størrelse. Den innerste sirkelen er rotnoden. Og området til barneknuten betyr% av dataene. | ![]() |
TreeMap | Treet er representert i form av rektangler tett pakket. Området angir mengden som er inneholdt. | ![]() |
Circle Packing | I likhet med et trekart bruker den sirkulær pakking i stedet for rektangler. | ![]() |
Nettverk: Visualiseringen av denne typen kobler datasett til datasett. Disse visualiseringene skildrer hvordan disse datasettene forholder seg til hverandre i et nettverk. | ||
Matriksdiagrammer | Denne typen visualisering er mye brukt for å finne sammenhengen mellom forskjellige variabler i seg selv. For eksempel korrelasjonsplott | ![]() |
Alluviale diagrammer | Dette er en type flytskjema der endringene i strømmen av nettverket er representert over intervaller som ønsket av brukeren. |
|
Word sky | Dette brukes vanligvis for å representere tekstdata. Ordene er tett pakket, og størrelsen på teksten betyr ordets hyppighet. |
|
Nodelink-diagrammer | Her er nodene representert som prikker og forbindelsen mellom nodene blir presentert. | ![]() |
Flerdimensjonal: I motsetning til den tidsmessige visualiseringstypen, kan disse typene ha flere dimensjoner. I dette kan vi bruke to eller flere funksjoner for å lage en 3D-visualisering gjennom samtidige lag. Disse vil gjøre det mulig for brukeren å presentere viktige takeaways ved å bryte mange ikke-nyttige data. | ||
Spredte tomter | I flerdimensjonale data velger vi hvilke som helst to funksjoner og plottes dem deretter inn i et 2-D spredningsdiagram. Ved å gjøre dette ville vi ha n C 2 = n (n-1) / 2 grafer. | ![]() |
Stablede søylediagrammer | Representasjonssegmentet linjer oppå hverandre. Det kan være 100% stablet søylediagram der segregeringen er representert i% eller enkel stablet søylediagram som angir den faktiske størrelsesorden | ![]() |
Parallell koordinat plot | I denne representasjonen tegnes et bakteppe, og n parallelle linjer tegnes (for n-dimensjonale data). | ![]() |
Geospatial: Disse visualiseringene angår den fysiske beliggenheten i det virkelige liv ved å krysse den over med kart (det kan være et geospatialt eller romlig kart). Intuisjonen bak disse visualiseringene er å skape et helhetlig syn på ytelse. | ||
Flytskart | Bevegelse av informasjon eller objekter fra ett sted til et annet presenteres der størrelsen på pilen angir beløpet. | ![]() |
Choropleth-kart | Det geospatiale kartet er farget på grunnlag av en bestemt datavariabel. | ![]() |
Cartogram | Denne typen representasjoner bruker den tematiske variabelen for kartlegging. Disse kartene forvrenger virkeligheten for å presentere informasjon. Dette betyr at kartene er overdrevet på en bestemt variabel. For eksempel er bildet til venstre et romlig kart forvrengt til en bikube. | ![]() |
Varmekart | Disse ligner veldig på Choropleth i geospatial sjanger, men kan også brukes i områder bortsett fra geospatial. | ![]() |
Diverse: Disse visualiseringene kan ikke generaliseres i en spesielt stor gruppe. Så i stedet for å danne mindre grupper for den enkelte type, grupperer vi det i diverse. Få eksempler er nedenfor: | ||
Åpne-høyt-lavt-nært diagram | Denne typen grafer brukes vanligvis til aksjekursrepresentasjon. Den økende trenden kalles like Bullish og synkende som Bearish. | ![]() |
Kagi-Chart | Typisk er etterspørselstilførselen til en eiendel representert ved hjelp av dette diagrammet. | ![]() |
Konklusjon
Fra de ovennevnte typer visualisering ser vi at det stort sett er 6 typer grupper. Listen over er ikke en uttømmende liste, men få som er mye brukt. I de kommende tider når og når nye typer blir lagt inn i listen, kan gruppene øke. Det er det for typer visualisering. Vi ville fortsette med hvilke parametere vi skal se på under fiksering av typen visualisering.
Anbefalte artikler
Dette er en guide til typen datavisualisering. Her diskuterer vi Introduksjon og forskjellige typer datavisualisering. Du kan også gå gjennom de andre foreslåtte artiklene våre for å lære mer–
- Typer av dataanalyseteknikker
- Talend Data Integration
- Verktøy til analyse av data
- Data Science Tools
- Talend Tools
- Hva er dataintegrasjon?
- Sprede tomter i Matlab
- Hvordan søylediagrammet brukes i Matlab (eksempler)