Introduksjon til Scatterplot i R

  • R er et programmeringsspråk med åpen kildekode som brukes til datastatistikk og dataanalyse. Med den økende populariteten til datavitenskap har R også vunnet popularitet. Det brukes hovedsakelig av datastatistikere og datagruver for å trekke ut verdifull informasjon fra data. R er et tolket språk og har et kommandolinjegrensesnitt, men det er mange grafiske brukergrensesnitt tilgjengelig for å gjøre utviklerens jobber lettere. R tilbyr et stort utvalg av biblioteker for implementering av statistikk og grafiske teknikker. R tilbyr statisk grafikk; den lar brukeren bygge en lagdelt graf. Dermed produserer den grafer av publikasjonskvalitet og gir en bedre representasjon av informasjon.
  • R tilbyr et stort sett med biblioteker for grafisk implementering, men mest populært er “ggplot2”. GGPlot2 en implementering av “Grammar of graphics” som gjør opprettelsen av komplekse grafer enkel. Den gir et programmatisk grensesnitt for å spesifisere variabler, deres plassering, fargen på grafen, graftyper og andre visualiseringsegenskaper. Det lar deg bygge grafer trinn for trinn, slik at du kan lage lag for omfattende fleksibilitet og publikasjonskvalitet.
  • En slik type graf er Scatterplot i R. Scatterplot i R, også kalt et scatter-diagram, som er en type graf som viser sammenhengen mellom to variabler. Den viser datapunktene i form av prikker. Det kan trekkes mellom en kontinuerlig uavhengig variabel og en annen variabel som avhenger av den forrige variabelen eller to kontinuerlige uavhengige variabler. Korrelasjon kan være positiv, negativ eller null. Hvis helningen på grafen er fra nedre venstre til øvre høyre, er korrelasjonen positiv. Hvis skråningen er fra øvre venstre til nedre høyre, er korrelasjonen negativ, eller med andre ord økning i verdien til en variabel vil redusere verdien av en annen variabel.

Syntaks: Det er mange pakker i R for grafer, derfor er det mange funksjoner for å lage en Scatterplot i R. Den mest grunnleggende og enkle funksjonen er

tomt (x, y)

hvor

x betegner den horisontale aksen eller den uavhengige kontinuerlige variabelen.

y betegner den vertikale aksen eller den avhengige variabelen.

Det er mange andre parametere å plotte funksjonen for å gjøre grafen enkel å forstå.

Nedenfor er noen med en definisjon:

  • main: legger til en tittel til grafen
  • xlab: legg til en etikett på x-aksen
  • ylab: legger til en etikett til y-aksen
  • xlim: spesifiserer rekkevidden til x-aksen
  • ylim: spesifiserer rekkevidden til y-aksen
  • pch: indikerer formen til punkter i scatter-plottet
  • cex: indikerer størrelsen på poeng
  • col: definerer fargen på poeng

En Scatterplot i R kan også opprettes med ggplot2-pakken. For dette må vi først installere og laste ggplot2-pakken. Etter å ha lagt pakken til gjeldende økt nedenfor kan kommandoen brukes til å lage en Scatterplot i R.

ggplot (datasett, aes (x, y, farge, form)) + geom_poin () + laboratorier (x, y, tittel)

hvor

  • datasettet er datasettet som scatterplot må opprettes for.
  • aes () er estetisk kartlegging i en graf. Den beskriver hvordan variabler er kartlagt på grafen.
  • x er den horisontale aksen eller den uavhengige kontinuerlige variabelen.
  • y er den vertikale aksen eller den avhengige variabelen.
  • farge er å legge farge til poeng basert på gruppevariabel.
  • formen brukes til å sette form basert på grupperingsvariabel.
  • + -tegn indikerer at kommandoen fortsetter.
  • geom_point () er funksjon for scatter-plot.
  • labs (x, y, title): legg til x label, y label og title til graf.

Lag Scatterplot i R

For å lage en Scatterplot i R, må vi først laste datasettet. Her bruker vi datasett (mtcars) levert av R. Last først datasettet inn i gjeldende økt ved å bruke kommandoen nedenfor

data (iris)

Når datasettet er lastet inn, kan du se på dataene for å få en grunnleggende forståelse av type data og kolonner i det ved å bruke kommandoen nedenfor.

iris

Etter å ha fått en grunnleggende forståelse av data, kan vi lage en enkel scatterplot ved hjelp av plottfunksjon

plot (iris $ Sepal. Lengde, iris $ Sepal. Bredde, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 5, 0))

Legge til etiketter for å gjøre grafen lesbar

plott (iris $ Sepal. Lengde, iris $ Sepal. Bredde, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = “Sepal Length”, ylab = “Sepal Width”, hoved = “Bredde vs lengde ”)

Legger til noe mer parameter for å gjøre grafen mer attraktiv

plott (iris $ Sepal. Lengde, iris $ Sepal. Bredde, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = “Sepal Length”, ylab = “Sepal Width”, hoved = “Bredde vs lengde ”, pch = 8, cex = 1, 5, col = 6)

Bortsett fra disse 2-D-tomtene, kan det også lages matrise-plott og 3-D-tomter i R.

Scatterplot-matriser

Når vi har mer enn to variabler i et datasett, og vi ønsker å finne en korrelasjon mellom hver variabel og alle andre variabler, brukes scatterplot-matrisen. Den mest grunnleggende og enkle kommandoen for scatterplot-matrise er:

par (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris, main = ”Scatterplot Matrix”)

Grafen over viser sammenhengen mellom vekt, mpg, dsp og cyl.

Scatterplot 3D

Noen ganger gir en tredimensjonal graf en bedre forståelse av data. For denne R gir flere pakker, en av dem er “scatterplot3d”. Nedenfor er kommandoene for å installere “scatterplot3d” i R-arbeidsområdet og laste det inn i den nåværende økten

install.packages ( “scatterplot3d”)

bibliotek (scatterplot3d)

Etter å ha lastet inn biblioteket, vil utførelsen av kommandoene nedenfor opprette en 3D-spredningsdiagram.

feste (iris)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = “3D Scatterplot”)

Bortsett fra dette er det mange andre måter å lage en 3-dimensjonal på. Brukere kan også legge til detaljer som farger, titler for å gjøre grafen bedre. Brukeren kan også lage interaktiv 3D-scatterplot ved å bruke “plot3D (x, y, z)” -funksjonen levert av “rgl” -pakken. Denne funksjonen lager en spinnende 3D-spredningsdiagram som kan roteres med en mus. Dermed gir du en fullstendig oversikt over sammenhengen mellom variablene.

Konklusjon

R er et av de mest kjente språkene for implementering av grafiske teknikker brukt av dataforskere. Det gir et bredt spekter av pakker og biblioteker for grafikk og en bedre forståelse av data. "Gglpot2", "ggvis", "rgl", "plot3d", "gitter", "animasjon", "gganimate", "cairo" er noen av pakkene levert av R.

En scatter-plot er den enkleste måten å få en bedre forståelse av data. Ved å bruke denne visualiseringen kan bruker bli kjent med hvordan variabler er relatert til hverandre, hvordan endring av verdi på en variabel vil endre verdien på andre variabler osv. Helningen på diagrammet forteller om det positive og negative forholdet mellom variablene.

Anbefalte artikler

Dette er en guide til Scatterplot i R. Her diskuterer vi en introduksjon, scatterplot matriser, scatterplot 3D, hvordan lage scatterplot? sammen med passende eksempler. Du kan også gå gjennom andre foreslåtte artikler for å lære mer -

  1. Hva er GraphQL
  2. Scrum Framework
  3. R Intervjuespørsmål
  4. Introduksjon til binomial distribusjon i R

Kategori: