Introduksjon til Boxplot-etiketter i R

Boxplot-etiketter hjelper til med visualisering av distribuerte data i R. Grafen representerer middelverdien, medianen og variansen. Verdiene er gitt som inngang til funksjonsboksen (). Boxplot () -funksjonen oppretter boxplot ved hjelp av gitte inndata. Boxplot kan opprettes for individuelle variabler eller en gruppe.

Plott av kartplottgrafen

  • Vi trenger fem verdsatte innspill som middel, varians, median, første og tredje kvartil.
  • Identifisere om det er noen utliggere i dataene.
  • Design modellen for å plotte dataene.

Parametere under boxplot () -funksjon

  1. formel: Denne parameteren gjør det mulig å søle numeriske verdier i flere grupper.
  2. Data :: Inndata som inneholder enten en dataramme eller en liste.
  3. Delmengde: Valgfri vektorparameter for å spesifisere et delsett for plotting.
  4. xlab: merking av x-aksen
  5. ylab: kommentar på y-aksen.
  6. rekkevidde: område spesifiserer plotutvidelsene.
  7. handling: spesifiser hva som skal skje når det er nullverdi. Enten ignorerer responsen eller verdien.

Opprette tilfeldige data

Vi kan lage tilfeldige eksempeldata gjennom rnorm () -funksjonen.

La oss nå bruke rnorm () til å lage tilfeldige eksempeldata på 10 verdier.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Over kommando genererer 10 tilfeldige verdier med gjennomsnitt 3 og standardavvik = 2 og lagrer det i datarammen.

Når vi skriver ut dataene får vi utdata nedenfor.

STAT1

1 2.662022

2 2.184315

3 5.974787

4 4.536203

5 4.808296

6 3.817232

7 1.135339

8 1.583991

9 3.308994

10 4.649170

Vi kan konvertere den samme inngangen (data) til boxplot-funksjonen som genererer plottet.

Vi legger til flere verdier til dataene og ser hvordan plottet endres.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Legge til flere tilfeldige verdier og bruke dem til å representere en graf.

Nedenfor er verdier som er lagret i datavariabelen.

STAT 1STAT 2STAT 3STAT 4
3.7954654, 218645.8275852.157315
0.9117264, 091196.2608112, 26594
3.7078283, 359875, 889453.714557
0.1157724, 51235.9348582, 40645
0.6975562, 159456, 811472.571304
5.1292313, 26986.2500683.025175
5.4041014, 389395.6700612, 9901
1.4550663, 130595.6923232, 69693
0.8686365, 423115.4154352.674768
2, 141133, 907286.2060592.806656

Nedenfor er kartplotgrafen med 40 verdier. Vi har 1-7 tall på y-aksen og stat1 til stat4 på x-aksen.

Vi kan endre tekstinnretningen på x-aksen ved å bruke en annen parameter kalt las = 2.

Analysere grafen til R Boxplot-etiketter

Vi har gitt innspillene i datarammen og vi ser plottet ovenfor.

For å forstå dataene, la oss se på stat1-verdiene.

Plottet representerer alle de 5 verdiene. Begynner med minimumsverdien fra bunnen og deretter den tredje kvartilen, middel, første kvartil og minimumsverdien.

Plottet ovenfor har tekstjustering horisontalt på x-aksen.

Endre farge

I alle eksemplene ovenfor har vi sett plottet i svart og hvitt. La oss se hvordan vi endrer farge på plottet.

Vi kan legge til parameteren col = color i boxplot () -funksjonen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Nedenfor kan vi se plottutgangen i rødt.

Ved å bruke den samme koden ovenfor kan vi legge til flere farger på plottet.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Legge til etiketter

Vi kan legge til etiketter ved å bruke xlab-, ylab-parameterne i boxplot-funksjonen.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Ved å bruke hovedparameteren, kan vi legge til overskrift til plottet.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Hakkparameter brukes for å gjøre plottet mer forståelig. Som medianer av stat1 til stat4 stemmer ikke overens med det ovennevnte plottet.

Fordeler og ulemper ved boksplottet

Fordeler

  • Det er enkelt å oppsummere store datamengder med boksplottetiketter.
  • Viser rekkevidde og datadistribusjon på aksen.
  • Det indikerer symmetri og skeivhet
  • Hjelper med å identifisere outliers i dataene.

ulemper

  • Kan bare brukes til numeriske data.
  • Hvis det er avvik i dataene, kan ikke boksplottet være nøyaktig.

Merknader:

  1. Grafer må merkes riktig.
  2. Skala er viktig; endring av skalaer kan gi data et annet syn.
  3. Sammenligning av data med riktig skala skal være konsekvent

Konklusjon - R Boxplot-etiketter

Datagrupperingen gjøres enkelt ved hjelp av kasseplott. Box plot støtter flere variabler samt forskjellige optimaliseringer. Vi kan også variere skalaene i henhold til data.

Boxplots kan brukes til å sammenligne forskjellige datavariabler eller sett.

Brukervennligheten til boxplot er enkel og praktisk. Vi trenger jevnlige data og riktige etiketter. Boxplots brukes ofte i data science og til og med av salgsteam for å gruppere og sammenligne data. Boxplot gir innsikt i potensialet i dataene og optimaliseringer som kan gjøres for å øke salget.

Boxplot er en interessant måte å teste dataene som gir innsikt i dataenes innvirkning og potensial.

Anbefalte artikler

Dette er en guide til R Boxplot-etiketter. Her diskuterer vi parameterne under boxplot () -funksjonen, hvordan lage tilfeldige data, endre farge- og grafanalyse sammen med fordelene og ulempene. Du kan også se på følgende artikkel for å lære mer -

  1. Typer datavisualisering
  2. Implementering av datavarehus
  3. Datavitenskapsteknikker
  4. Hva er Data Cube?

Kategori: