Introduksjon til Boxplot-etiketter i R
Boxplot-etiketter hjelper til med visualisering av distribuerte data i R. Grafen representerer middelverdien, medianen og variansen. Verdiene er gitt som inngang til funksjonsboksen (). Boxplot () -funksjonen oppretter boxplot ved hjelp av gitte inndata. Boxplot kan opprettes for individuelle variabler eller en gruppe.
Plott av kartplottgrafen
- Vi trenger fem verdsatte innspill som middel, varians, median, første og tredje kvartil.
- Identifisere om det er noen utliggere i dataene.
- Design modellen for å plotte dataene.
Parametere under boxplot () -funksjon
- formel: Denne parameteren gjør det mulig å søle numeriske verdier i flere grupper.
- Data :: Inndata som inneholder enten en dataramme eller en liste.
- Delmengde: Valgfri vektorparameter for å spesifisere et delsett for plotting.
- xlab: merking av x-aksen
- ylab: kommentar på y-aksen.
- rekkevidde: område spesifiserer plotutvidelsene.
- handling: spesifiser hva som skal skje når det er nullverdi. Enten ignorerer responsen eller verdien.
Opprette tilfeldige data
Vi kan lage tilfeldige eksempeldata gjennom rnorm () -funksjonen.
La oss nå bruke rnorm () til å lage tilfeldige eksempeldata på 10 verdier.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))
Over kommando genererer 10 tilfeldige verdier med gjennomsnitt 3 og standardavvik = 2 og lagrer det i datarammen.
Når vi skriver ut dataene får vi utdata nedenfor.
STAT1
1 2.662022
2 2.184315
3 5.974787
4 4.536203
5 4.808296
6 3.817232
7 1.135339
8 1.583991
9 3.308994
10 4.649170
Vi kan konvertere den samme inngangen (data) til boxplot-funksjonen som genererer plottet.
Vi legger til flere verdier til dataene og ser hvordan plottet endres.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)
Legge til flere tilfeldige verdier og bruke dem til å representere en graf.
Nedenfor er verdier som er lagret i datavariabelen.
STAT 1 | STAT 2 | STAT 3 | STAT 4 |
3.795465 | 4, 21864 | 5.827585 | 2.157315 |
0.911726 | 4, 09119 | 6.260811 | 2, 26594 |
3.707828 | 3, 35987 | 5, 88945 | 3.714557 |
0.115772 | 4, 5123 | 5.934858 | 2, 40645 |
0.697556 | 2, 15945 | 6, 81147 | 2.571304 |
5.129231 | 3, 2698 | 6.250068 | 3.025175 |
5.404101 | 4, 38939 | 5.670061 | 2, 9901 |
1.455066 | 3, 13059 | 5.692323 | 2, 69693 |
0.868636 | 5, 42311 | 5.415435 | 2.674768 |
2, 14113 | 3, 90728 | 6.206059 | 2.806656 |
Nedenfor er kartplotgrafen med 40 verdier. Vi har 1-7 tall på y-aksen og stat1 til stat4 på x-aksen.
Vi kan endre tekstinnretningen på x-aksen ved å bruke en annen parameter kalt las = 2.
Analysere grafen til R Boxplot-etiketter
Vi har gitt innspillene i datarammen og vi ser plottet ovenfor.
For å forstå dataene, la oss se på stat1-verdiene.
Plottet representerer alle de 5 verdiene. Begynner med minimumsverdien fra bunnen og deretter den tredje kvartilen, middel, første kvartil og minimumsverdien.
Plottet ovenfor har tekstjustering horisontalt på x-aksen.
Endre farge
I alle eksemplene ovenfor har vi sett plottet i svart og hvitt. La oss se hvordan vi endrer farge på plottet.
Vi kan legge til parameteren col = color i boxplot () -funksjonen.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data
Nedenfor kan vi se plottutgangen i rødt.
Ved å bruke den samme koden ovenfor kan vi legge til flere farger på plottet.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data
Legge til etiketter
Vi kan legge til etiketter ved å bruke xlab-, ylab-parameterne i boxplot-funksjonen.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data
Ved å bruke hovedparameteren, kan vi legge til overskrift til plottet.
data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data
Hakkparameter brukes for å gjøre plottet mer forståelig. Som medianer av stat1 til stat4 stemmer ikke overens med det ovennevnte plottet.
Fordeler og ulemper ved boksplottet
Fordeler
- Det er enkelt å oppsummere store datamengder med boksplottetiketter.
- Viser rekkevidde og datadistribusjon på aksen.
- Det indikerer symmetri og skeivhet
- Hjelper med å identifisere outliers i dataene.
ulemper
- Kan bare brukes til numeriske data.
- Hvis det er avvik i dataene, kan ikke boksplottet være nøyaktig.
Merknader:
- Grafer må merkes riktig.
- Skala er viktig; endring av skalaer kan gi data et annet syn.
- Sammenligning av data med riktig skala skal være konsekvent
Konklusjon - R Boxplot-etiketter
Datagrupperingen gjøres enkelt ved hjelp av kasseplott. Box plot støtter flere variabler samt forskjellige optimaliseringer. Vi kan også variere skalaene i henhold til data.
Boxplots kan brukes til å sammenligne forskjellige datavariabler eller sett.
Brukervennligheten til boxplot er enkel og praktisk. Vi trenger jevnlige data og riktige etiketter. Boxplots brukes ofte i data science og til og med av salgsteam for å gruppere og sammenligne data. Boxplot gir innsikt i potensialet i dataene og optimaliseringer som kan gjøres for å øke salget.
Boxplot er en interessant måte å teste dataene som gir innsikt i dataenes innvirkning og potensial.
Anbefalte artikler
Dette er en guide til R Boxplot-etiketter. Her diskuterer vi parameterne under boxplot () -funksjonen, hvordan lage tilfeldige data, endre farge- og grafanalyse sammen med fordelene og ulempene. Du kan også se på følgende artikkel for å lære mer -
- Typer datavisualisering
- Implementering av datavarehus
- Datavitenskapsteknikker
- Hva er Data Cube?