Hva er datavisualisering?

Og hvorfor vi ikke bryr oss om kakediagrammer lenger,

Datavisualisering er ikke bare en oversettelse av datapunkter til lune stolpediagrammer og linjediagrammer. Det er som et dykk i et hav som skjuler skatter på hvert nivå. Helt på begynnelsen har vi en grei avgrensning av data i lærebokfigurer, nemlig. spredningsdiagrammer, linjediagrammer, kakediagrammer og stolpediagrammer. Linjediagrammer brukes vanligvis for å skildre en trend med data over tid. I dette emnet om hva som er datavisualisering, har vi tømt hele konseptet fremover med de gitte graf- og kakediagrammer.

Kakediagrammer

Et av de mest allestedsnærværende listene som er i bruk er pizzakartet eller kakediagrammet.

Andel gasser i en blanding.

Kilde : plottet

Vanligvis brukt under valg for å vise hvilket parti som har fått løvene til å dele stemmer, har dette diagrammet, selv om det er ekstremt populært, noen gnistrende ulemper. Statistikere som Edward Tufte, Leland Wilkinson og Gerald van Belle har gitt uttrykk for at de var misfornøyd med bruken av kakediagrammer. Det mest avgjørende beviset mot kakediagrammer har sannsynligvis blitt gitt av Stephen Few, grunnleggeren av Perceptual Edge. I sin artikkel, "Save the Pie for the Dessert" publisert i Visual Business Intelligence Newsletter, forklarer Stephen hvorfor han til overraskelse fra kollegene og studentene hans føler at kakediagrammer er et ineffektivt middel til å visualisere data.

Ta en titt på kakediagrammet nedenfor.

I denne grafen som viser andelen matvarer som er bestilt etter 21.00, er det lett å estimere prosentandelen som tilhører Ice Cream - 25%. Etter liten modifisering er det imidlertid ikke lenger mulig å fastslå hvor mange prosent ordrer som går på is.

Selv om prosentandelen av iskrem fortsatt er den samme på 25%. Det er vanskelig å forstå fra diagrammet over. I det forrige diagrammet var det lett å gjette prosentandelen fordi skyggen for iskrem begynte på 6 o 'klokkeposisjon og strakte seg til 9 o' klokkens stilling. Når øynene våre er opplært til å se klokkene på 12, 3, 6 og 9 - er et kakediagram også lettere å tolke hvis regionene holder seg til de 4 klokkestillingene. En ivrig cirkeldiagramssupporter ville komme frem og antydet at dette problemet lett kunne unngås ved å bruke etiketter og markere prosentandelen mot hver region.

Kakediagram med datatiketter

Men igjen, for å kartlegge verdien med varen, må øynene våre fortsette å skifte fokus fra legenden nederst på grafen til etikettene på diagrammet. Løsningen på det ville være å knytte varenavnet også sammen med verdiene - for å få noe som ligner på dette:

Perfekt, vil du si. Men så spør jeg deg - Nå som vi har lagt ved navnene på varene sammen med verdiene, hvordan er kakediagrammet ovenfor annerledes enn tabellen nedenfor:

Rengjør tabell med data sortert etter Andel av ordre

Ser denne informasjonen ikke så mye bedre ut enn etikettene og legender spredt over kakediagrammet. Hva bruker du et kakediagram da? Visualiseringer skal visstnok tilføre verdi, de er agenter for konklusjoner, de skal visstnok få dataene til å avsløre dens hemmeligheter. Men i dette tilfellet oppfyller ikke kakediagrammet sitt løfte.

Gå inn i søylediagrammet for datavisualisering

Det slankere og mye mer elegante alternativet til kakediagrammet er søylediagrammet, som er i stand til å uttrykke alt det kaken sier og mye mer, uten å lage et rot av etiketter og sagn.

Søylediagram som skildrer det samme - enkelt å sammenligne, kontrastere og konkludere

Dette er den samme informasjonen som nå blir presentert forsiktig for observatøren. I tillegg til å vise de individuelle verdiene, lar denne grafen oss raskt sammenligne populariteten til hver matvare og til og med sammenligne den relative forskjellen i verdi mellom påfølgende varer. Samme data ville vært tilgjengelig gjennom tabellen, men hjernen vår er flinkere til å behandle bilder enn å dechiffrere teksten. Dette er grunnen til at bruken av kakediagrammet har redusert over tid. Selv om det er et yndlingsvisual i mediebransjen, er dette erstattet av bedre og mer sofistikerte fremstillinger. Foruten linjediagrammer, paier og søylediagrammer er det et utall andre diagrammer som kommer godt med. En interessant graf, men ikke så populær for de uinnvidde, er Sankey Diagram. Dette diagrammet brukes til å uttrykke fordeling og flyt av materie. Saken det gjelder kan være energi, penger eller til og med vann.

Sankey Diagram over energiflyten og distribusjonen til en typisk IT-ansatt.

Over er et fiktivt Sankey-diagram som uttrykker hvordan og hvor mesteparten av energien til en IT-ansatt distribueres.

Nyere verktøy

Med fremveksten av sosiale medier og de forskjellige plattformene der folk kan skrive ut sine følelser, anmeldelser og mening, er et datavisualiseringsverktøy som har blitt ganske vanlig, ordskyen. Ordskyer hjelper oss med å finne ut hva folk snakker om.

En veldig ekte, live word cloud-representasjon av brukeranmeldelser av PUBG i google play store

Hvis vi ser på ordet sky her som er bygget fra de 80 beste anmeldelsene av spillet PUBG i google play store, ser vi at den generelle responsen på spillet er "bra", og noen kaller det til og med "det beste" . Det virker imidlertid som om det er et problem med noen "oppdatering" som folket ber med spillskaperne om å rette opp. Når vi sjekker anmeldelser fra lekebutikken den dagen, ser vi faktisk at det samme gjenspeiles.

Problemet med oppdateringer. Se også om du kan finne en forekomst av ordet "vær så snill" her

Fremtiden

Dette er bare å klø i toppen av isfjellet. Biblioteker som plotly og D3 har tatt datavisualisering til et annet nivå. Dette har skjedd på grunn av at etterspørselen også har endret seg. Hvordan vil du visualisere en smart by på et dashbord? En gigantisk skjerm som vitalitetene fra en hel by kan vises på. Trafikken, strømbruken, helsemessige forhold i forskjellige områder, luftkvalitet og en rekke andre parametere må vises på en enkelt side. Dette kravet ber om en annen tilnærming til datavisualisering Så vi har lært at hva som er datavisualisering ved hjelp av dette konseptet. Vi kan ikke lenger holde oss til diagrammer og grafer. Det kreves en ny tilnærming der grafer møter kunst og fantasi, og skaper en berikende visuell opplevelse. Denne diskusjonen ber om en annen artikkel. Til neste gang.

Anbefalte artikler

Denne artikkelen er en nyttig guide for hva som er datavisualisering. Her har vi diskutert de grunnleggende konseptene med diagrammer og grafer slik at du enkelt kan forstå datavisualisering. Du kan også se på følgende artikkel for å lære mer -

  1. Karriere i Oracle-databaseadministrator
  2. 7 Den mest nyttige forskjellen mellom Data mining vs Web mining
  3. Data Analytics intervjuspørsmål
  4. Eksempler på Big Data Analytics

Kategori: