Outliers Formula (Innholdsfortegnelse)

  • Outliers Formula
  • Eksempler på formelere for utskyttere (med Excel-mal)

Outliers Formula

I statistikk er Outliers de to ekstreme distanserte uvanlige punktene i de gitte datasettene. Den ekstremt høye verdien og ekstremt lave verdiene er de ytre verdiene til et datasett. Dette er veldig nyttig for å finne eventuelle feil eller feil som oppsto. Bare som navnet sier, Outliers er verdier som løy utenfor for resten av verdiene i datasettet. Eksempel, vurder ingeniørstudenter og forestill deg at de hadde dverger i klassen sin. Dverger er altså menneskene som har ekstremt lav høyde sammenlignet med andre normalhøyde. Så dette er den ytre verdien i denne klassen. Tidligere verdier kan beregnes ved å bruke Tukey-metoden.

Formelen for Outliers -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Eksempler på formelere for utskyttere (med Excel-mal)

La oss ta et eksempel for å forstå beregningen av Outliers-formelen på en bedre måte.

Du kan laste ned denne Outliers-malen her - Outliers Template

Outliers Formula - Eksempel # 1

Tenk på følgende datasett og beregn utleggerne for datasettet.

Datasett = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Stigende rekkefølge på datasettet:

Median for stigende ordredatasett beregnes som:

I dette datasettet er det totale antall data 11. Så n = 11. Median = 11 + 1/2 = 12/2 = 6. Derfor er verdien som er i 6. plassering i dette datasettet median.

Så medianverdi = 34.

Del datasettet i 2 halvdeler ved å bruke median.

Median for datasett til nedre halvdel og øvre halvdel beregnes som:

  • I den nedre halvdelen av 2, 5, 6, 7, 23, hvis vi finner medianen som hvordan vi fant i trinn 2, ville medianverdien være 6. Så Q1 = 6.
  • I øvre halvdel 45, 56, 89, 98, 309 hvis vi finner medianen som hvordan vi fant i trinn 2, ville medianverdien være 89. Så Q3 = 89.

IQR beregnes ved å bruke formelen gitt nedenfor

IQR = Q3 - Q1

  • IQR = 89-6
  • IQR = 83

Lower Outlier beregnes ved å bruke formelen gitt nedenfor

Nedre Outlier = Q1 - (1, 5 * IQR)

  • Nedre Outlier = 6 - (1, 5 * 83)
  • Nedre Outlier = -118, 5

Higher Outlier beregnes ved å bruke formelen gitt nedenfor

Høyere Outlier = Q3 + (1, 5 * IQR)

  • Høyere Outlier = 89 + (1, 5 * 83)
  • Høyere Outlier = 213, 5

Hent nå disse verdiene i datasettet -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Verdier som faller under i nedre sideverdi og over på høyere side er outlier-verdien. For dette datasettet er 309 outlier.

Outliers Formula - Eksempel # 2

Tenk på følgende datasett og beregn utleggerne for datasettet.

Datasett = 45, 21, 34, 90, 109.

Stigende rekkefølge på datasettet:

Median for stigende ordredatasett beregnes som:

I dette datasettet er det totale antall data 5. Så n = 5. Median = 5 + 1/2 = 6/2 = 3. Derfor er verdien som ligger i 3. plassering i dette datasettet median.

Så medianverdi = 45.

Del datasettet i 2 halvdeler ved å bruke median.

Median for datasett til nedre halvdel og øvre halvdel beregnes som:

  • Q1 = 27, 5
  • Q3 = 89

IQR beregnes ved å bruke formelen gitt nedenfor

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Lower Outlier beregnes ved å bruke formelen gitt nedenfor

Nedre Outlier = Q1 - (1, 5 * IQR)

  • Nedre Outlier = 27, 5 - (1, 5 * 72)
  • Nedre Outlier = -80, 5

Higher Outlier beregnes ved å bruke formelen gitt nedenfor

Høyere Outlier = Q3 + (1, 5 * IQR)

  • Høyere Outlier = 99, 5 + (1, 5 * 72)
  • Høyere Outlier = 207, 5

Forklaring

Trinn 1: Ordne alle verdiene i det gitte datasettet i stigende rekkefølge.

Trinn 2: Finn medianverdien for dataene som er sortert. Median kan bli funnet ved hjelp av følgende formel. Følgende beregning gir deg ganske enkelt plasseringen av medianverdien som ligger i datosettet.

Median = (n + 1) / 2

Hvor n er det totale antallet tilgjengelige data i datasettet.

Trinn 3: Finn den lavere kvartilverdien Q1 fra datasettet. For å finne dette ved å bruke medianverdien, deles datasettet i to halvdeler. Finn median for det nedre settet som er Q1-verdien fra det nedre halvsettet av verdier.

Trinn 4: Finn den øvre kvartilverdien Q3 fra datasettet. Det er akkurat som trinnet ovenfor. I stedet for den nedre halvdelen, må vi følge den samme prosedyren for øvre halvdel av verdiene.

Trinn 5: Finn IQR-verdien for Interquartile Range. For å finne fradrag Q1 verdien fra Q3.

IQR = Q3-Q1

Trinn 6: Finn den indre ekstreme verdien. En ende som faller utenfor undersiden som også kan kalles en mindre uteligger. Multipliser IQR-verdien med 1, 5 og trekk denne verdien fra Q1 gir deg indre indre ekstreme.

Nedre Outlier = Q1 - (1, 5 * IQR)

Trinn 7: Finn den ytre ekstreme verdien. En ende som faller utenfor høyresiden som også kan kalles en større outlier. Multipliser IQR-verdien med 1, 5 og sum denne verdien med Q3 gir deg Ytre Høyere ekstrem.

Høyere Outlier = Q3 + (1, 5 * IQR)

Trinn 8: Verdier som faller utenfor disse indre og ytre ytterpunktene er de ytre verdiene for det gitte datasettet.

Relevans og bruk av formidlere for utskyttere

Outliers er veldig viktige i ethvert dataanalyseproblem. Tidligere viser inkonsekvens i ethvert datasett, da det er definert som de uvanlige fjerne verdiene i datasettet fra det ene til det andre. Dette er veldig nyttig når du vil finne eventuelle feil som oppsto i datasettet. For når du plasserer en feil i datasettet, påvirker det middelverdien og median kan dermed få store avvik i resultatet hvis Outliers er i datasettet. Derfor er det viktig å finne ut Outliers fra datasettet for å unngå alvorlige problemer i den statistiske analysen.

Anbefalte artikler

Dette har vært en guide til Outliers-formelen. Her diskuterer vi hvordan du beregner Outliers sammen med praktiske eksempler og nedlastbar Excel-mal. Du kan også se på følgende artikler for å lære mer -

  1. Guide to Midrange Formula
  2. Eksempler på lønnsformel
  3. Kalkulator for DPMO-formel
  4. Hvordan beregne T-distribusjon?
  5. Kvartil avviksformel | eksempler