Outliers Formula (Innholdsfortegnelse)
- Outliers Formula
- Eksempler på formelere for utskyttere (med Excel-mal)
Outliers Formula
I statistikk er Outliers de to ekstreme distanserte uvanlige punktene i de gitte datasettene. Den ekstremt høye verdien og ekstremt lave verdiene er de ytre verdiene til et datasett. Dette er veldig nyttig for å finne eventuelle feil eller feil som oppsto. Bare som navnet sier, Outliers er verdier som løy utenfor for resten av verdiene i datasettet. Eksempel, vurder ingeniørstudenter og forestill deg at de hadde dverger i klassen sin. Dverger er altså menneskene som har ekstremt lav høyde sammenlignet med andre normalhøyde. Så dette er den ytre verdien i denne klassen. Tidligere verdier kan beregnes ved å bruke Tukey-metoden.
Formelen for Outliers -
Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)
Eksempler på formelere for utskyttere (med Excel-mal)
La oss ta et eksempel for å forstå beregningen av Outliers-formelen på en bedre måte.
Du kan laste ned denne Outliers-malen her - Outliers TemplateOutliers Formula - Eksempel # 1
Tenk på følgende datasett og beregn utleggerne for datasettet.
Datasett = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23
Stigende rekkefølge på datasettet:
Median for stigende ordredatasett beregnes som:
I dette datasettet er det totale antall data 11. Så n = 11. Median = 11 + 1/2 = 12/2 = 6. Derfor er verdien som er i 6. plassering i dette datasettet median.
Så medianverdi = 34.
Del datasettet i 2 halvdeler ved å bruke median.
Median for datasett til nedre halvdel og øvre halvdel beregnes som:
- I den nedre halvdelen av 2, 5, 6, 7, 23, hvis vi finner medianen som hvordan vi fant i trinn 2, ville medianverdien være 6. Så Q1 = 6.
- I øvre halvdel 45, 56, 89, 98, 309 hvis vi finner medianen som hvordan vi fant i trinn 2, ville medianverdien være 89. Så Q3 = 89.
IQR beregnes ved å bruke formelen gitt nedenfor
IQR = Q3 - Q1
- IQR = 89-6
- IQR = 83
Lower Outlier beregnes ved å bruke formelen gitt nedenfor
Nedre Outlier = Q1 - (1, 5 * IQR)
- Nedre Outlier = 6 - (1, 5 * 83)
- Nedre Outlier = -118, 5
Higher Outlier beregnes ved å bruke formelen gitt nedenfor
Høyere Outlier = Q3 + (1, 5 * IQR)
- Høyere Outlier = 89 + (1, 5 * 83)
- Høyere Outlier = 213, 5
Hent nå disse verdiene i datasettet -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Verdier som faller under i nedre sideverdi og over på høyere side er outlier-verdien. For dette datasettet er 309 outlier.
Outliers Formula - Eksempel # 2
Tenk på følgende datasett og beregn utleggerne for datasettet.
Datasett = 45, 21, 34, 90, 109.
Stigende rekkefølge på datasettet:
Median for stigende ordredatasett beregnes som:
I dette datasettet er det totale antall data 5. Så n = 5. Median = 5 + 1/2 = 6/2 = 3. Derfor er verdien som ligger i 3. plassering i dette datasettet median.
Så medianverdi = 45.
Del datasettet i 2 halvdeler ved å bruke median.
Median for datasett til nedre halvdel og øvre halvdel beregnes som:
- Q1 = 27, 5
- Q3 = 89
IQR beregnes ved å bruke formelen gitt nedenfor
IQR = Q3 - Q1
- IQR = 99, 5 - 27, 5
- IQR = 72
Lower Outlier beregnes ved å bruke formelen gitt nedenfor
Nedre Outlier = Q1 - (1, 5 * IQR)
- Nedre Outlier = 27, 5 - (1, 5 * 72)
- Nedre Outlier = -80, 5
Higher Outlier beregnes ved å bruke formelen gitt nedenfor
Høyere Outlier = Q3 + (1, 5 * IQR)
- Høyere Outlier = 99, 5 + (1, 5 * 72)
- Høyere Outlier = 207, 5
Forklaring
Trinn 1: Ordne alle verdiene i det gitte datasettet i stigende rekkefølge.
Trinn 2: Finn medianverdien for dataene som er sortert. Median kan bli funnet ved hjelp av følgende formel. Følgende beregning gir deg ganske enkelt plasseringen av medianverdien som ligger i datosettet.
Median = (n + 1) / 2
Hvor n er det totale antallet tilgjengelige data i datasettet.
Trinn 3: Finn den lavere kvartilverdien Q1 fra datasettet. For å finne dette ved å bruke medianverdien, deles datasettet i to halvdeler. Finn median for det nedre settet som er Q1-verdien fra det nedre halvsettet av verdier.
Trinn 4: Finn den øvre kvartilverdien Q3 fra datasettet. Det er akkurat som trinnet ovenfor. I stedet for den nedre halvdelen, må vi følge den samme prosedyren for øvre halvdel av verdiene.
Trinn 5: Finn IQR-verdien for Interquartile Range. For å finne fradrag Q1 verdien fra Q3.
IQR = Q3-Q1
Trinn 6: Finn den indre ekstreme verdien. En ende som faller utenfor undersiden som også kan kalles en mindre uteligger. Multipliser IQR-verdien med 1, 5 og trekk denne verdien fra Q1 gir deg indre indre ekstreme.
Nedre Outlier = Q1 - (1, 5 * IQR)
Trinn 7: Finn den ytre ekstreme verdien. En ende som faller utenfor høyresiden som også kan kalles en større outlier. Multipliser IQR-verdien med 1, 5 og sum denne verdien med Q3 gir deg Ytre Høyere ekstrem.
Høyere Outlier = Q3 + (1, 5 * IQR)
Trinn 8: Verdier som faller utenfor disse indre og ytre ytterpunktene er de ytre verdiene for det gitte datasettet.
Relevans og bruk av formidlere for utskyttere
Outliers er veldig viktige i ethvert dataanalyseproblem. Tidligere viser inkonsekvens i ethvert datasett, da det er definert som de uvanlige fjerne verdiene i datasettet fra det ene til det andre. Dette er veldig nyttig når du vil finne eventuelle feil som oppsto i datasettet. For når du plasserer en feil i datasettet, påvirker det middelverdien og median kan dermed få store avvik i resultatet hvis Outliers er i datasettet. Derfor er det viktig å finne ut Outliers fra datasettet for å unngå alvorlige problemer i den statistiske analysen.
Anbefalte artikler
Dette har vært en guide til Outliers-formelen. Her diskuterer vi hvordan du beregner Outliers sammen med praktiske eksempler og nedlastbar Excel-mal. Du kan også se på følgende artikler for å lære mer -
- Guide to Midrange Formula
- Eksempler på lønnsformel
- Kalkulator for DPMO-formel
- Hvordan beregne T-distribusjon?
- Kvartil avviksformel | eksempler