ANOVA (Varianseanalyse)

ANOVA står for Analysis Of Variance. ANOVA ble grunnlagt av Ronald Fisher i år 1918. Navnet Analysis Of Variance ble avledet basert på tilnærmingen der metoden bruker variansen for å bestemme middelet om de er forskjellige eller like.

Det er en statistisk metode som brukes for å teste forskjellene mellom to eller flere midler. Det brukes til å teste generelle forskjeller i stedet for spesifikke forskjeller mellom virkemidler. Den vurderer betydningen av en eller flere faktorer ved å sammenligne responsvariablene på forskjellige faktornivåer.

Nullhypotese sier at alle populasjonsmidler er like. Den alternative hypotesen beviser at minst en populasjonsmengde er forskjellig

Det gir en måte å teste forskjellige nullhypoteser samtidig.

Generelle formål med ANOVA

Årsaken til å utføre ANOVA er å se om det er noen forskjell mellom gruppene på en eller annen variabel. I dag bruker forskere ANOVA på mange måter. Bruken av ANOVA avhenger helt av forskningsdesignet.

Du kan bruke t-test for å sammenligne middelene til to prøver, men når det er mer enn to prøver å sammenligne, er ANOVA den beste metoden som skal brukes.

Antagelser om ANOVA

Det er fire hovedforutsetninger

  • De forventede verdiene på feilene er null
  • Avvikene til alle feilene er lik hverandre
  • Feilene er uavhengige
  • De er normalt distribuert

ANOVA-typer

  1. En vei mellom grupper

En måte ANOVA brukes til å sjekke om det er noen betydelig forskjell mellom midlene til tre eller flere ubeslektede grupper. Den tester hovedsakelig nullhypotesen.

H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ

Hvor µ betyr gruppemiddel og x betyr antall grupper. Én vei ANOVA gir et betydelig resultat. En måte ANOVA er en omnibusteststatistikk, og den vil ikke gi deg beskjed om hvilke spesifikke grupper som var forskjellige fra hverandre. For å kjenne den spesifikke gruppen eller gruppene som skilte seg fra andre, må du gjøre en post hoc-test.

Eksempel på enveis ANOVA

20 personer blir valgt ut for å teste effekten av fem forskjellige øvelser. 20 personer er delt inn i 4 grupper med 5 medlemmer hver. Vekten deres blir registrert etter noen dager. Effekten av øvelsene på den 5 gruppen av menn blir sammenlignet. Her er vekt den eneste faktoren.

Antagelser

Den avhengige variabelen fordeles normalt i hver gruppe

Det er homogenitet av avvik

Observasjoners uavhengighet

  1. Én vei ANOVA gjentatte tiltak

Gjentatte tiltak ANOVA er mer eller mindre lik Enveis ANOVA, men brukes til komplekse grupperinger. Gjentatte tiltak undersøker om 1. endringene i gjennomsnittlig score over tre eller flere tidspunkter

2. forskjeller i gjennomsnittsskår under forskjellige forhold.

Eksempel på gjentatte tiltak

Du kan undersøke effekten av et 6 måneders treningsprogram på vektreduksjon på noen individer. Du beregner vekten på tre forskjellige tidspunkter i løpet av treningsperioden for å utvikle et tidskurs for enhver treningseffekt.

Du kan unne deg den samme personen til å spise forskjellige typer vektreduserende mat og rangere dem etter smak.

I dette eksemplet måles det samme settet mennesker mer enn en gang på den samme avhengige variabelen.

  1. To veier mellom grupper

Den toveis ANOVA sammenligner middelforskjellen mellom grupper som er delt på to faktorer. Hovedmålet med en toveis ANOVA er å finne ut om det er noe samspill mellom de to uavhengige variablene på de avhengige variablene. Den lar deg også vite om effekten av en av de uavhengige variablene på den avhengige variabelen er den samme for alle verdiene til den andre uavhengige variabelen.

Eksempel

Forskningen om gjødselens effekt på risutbytte. Du bruker fem gjødsel av ulik kvalitet på fem tomter som hver dyrker ris. Utbyttet fra hver tomt registreres, og forskjellen mellom hver tomt blir observert. Her kan også effekten av fruktbarheten til tomtene studeres. Dermed er det to faktorer, gjødsel og fruktbarhet.

Antagelser

Før du begynner med toveis ANOVA, skal dataene dine passere seks forutsetninger for å sikre at dataene du har er tilstrekkelige for å utføre toveis ANOVA. De seks forutsetningene er listet opp nedenfor

  • Den avhengige variabelen din måles på kontinuerlig nivå
  • De to uavhengige variablene dine skal inneholde to eller flere kategoriske uavhengige grupper for hver
  • Du bør ha uavhengighet av observasjoner
  • Unngå utskyttere
  • Din avhengige variabel skal normalt fordeles for hver kombinasjon av gruppene til de to uavhengige variablene
  • Varianternes homogenitet
  1. To-veis gjentatte tiltak

Toveis gjentatte måler middelforskjellene mellom gruppene som har blitt delt i to innenfor de uavhengige variablene. Et toveis gjentatt mål brukes ofte i forskning der en avhengig variabel måles mer enn to ganger under to eller flere forhold.

Eksempel

En helseforsker ønsker å finne den beste måten å redusere kroniske leddsmerter som menneskene lider. Forskeren velger to forskjellige typer behandlinger for å redusere smertenivået. De to typene behandlinger er kjent som "tilstander". Behandling A er et massasjeprogram og Behandling B er et akupunkturprogram. Begge behandlingene blir gitt til alle pasientene i 8 uker.

Pasientene blir testet på tre tidspunkter - i begynnelsen av programmet, i midten av programmet og på slutten av programmet.

Forskeren velger 30 pasienter som skal delta i forskningen. Men når de første 15 pasientene gjennomgår behandling A, gjennomgår de 15 andre pasientene behandling B og omvendt.

På slutten av 8 uker bruker forskeren toveis gjentatte tiltak ANOVA for å finne ut om det er noen endring i smertene som et resultat av samspillet mellom behandlingstypen og på hvilket tidspunkt.

Antagelser

Dataene dine skal passere fem forutsetninger som er nødvendige for en toveis gjentatte mål ANOVA for å gi det nøyaktige resultatet.

  • Den avhengige variabelen din måles på kontinuerlig nivå
  • Dine to innen fagfaktorer skal bestå av minst to kategorirelaterte grupper
  • Det skal ikke være noen utliggere
  • Den avhengige variabelen skal normalt fordeles mellom hver kombinasjon av de relaterte gruppene
  • Avvikene mellom forskjellene mellom alle kombinasjoner av beslektede grupper skal være like

Parametrisk og ikke-parametrisk ANOVA-test

Hvis informasjonen om populasjonen er fullstendig kjent ved hjelp av dens parametere, kalles den utførte statistiske testen Parametrisk test.

Hvis informasjonen om populasjonen eller parametrene ikke er kjent, men fortsatt kreves for å teste hypotesen, kalles den ikke-parametrisk test.

Når du har kategoriske data, kan du ikke bruke ANOVA-metoden, du må bruke Chi square-test som omhandler ANOVA-interaksjon.

Prosedyre for hypotesetesting - Enveis ANOVA

  1. Sjekk nødvendig forutsetning og skriv null og alternativ hypotese

For å utføre en måte ANOVA, bør visse forutsetninger være der. Forutsetningene er som følger

  • Hver prøve er en uavhengig tilfeldig prøve
  • Fordelingen av responsvariabelen følger en normalfordeling
  • Befolkningsavvikene er like på tvers av svarene for gruppenivåene. Det kan bli funnet ut ved å dele det største utvalgsstandardavviket med den minste utvalgsstandarden, og det er ikke større enn to forutsetter da at populasjonsavvikene er like.
  1. Beregn en passende teststatistikk

En måte ANOVA bruker F-teststatistikk. Håndberegninger krever mange trinn for å beregne F-forholdet, men statistisk programvare som SPSS beregner F-forholdet for deg og vil produsere ANOVA-kildetabellen.

ANOVA-tabellen gir deg informasjon om variasjonen mellom grupper og i grupper. Tabellen gir deg all formelen. Nedenfor er eksemplet på en enveis ANOVA-tabell

KildeSSDFMSF
behandlingerSSTk-1SST / (k-1)MST / MSE
FeilSSEnkSSE / (NK)
Totalt (korrigert)SSN-1

SST betyr sum av kvadrater av behandlinger, SSE betyr sum av kvadrater med feil

DFT som er k-1 betyr grader av behandlingsfrihet, DFE som er Nk betyr grader av frihet for feil.

  1. Bestem ap-verdien assosiert med teststatistikken
  2. Bestem mellom null og alternativ hypotese

Hvis nullhypotesen er falsk, bør MST være større enn MSE

  1. Gi en konklusjon

Basert på resultatet ditt, skriv en konklusjon i henhold til anova-forskningsspørsmålet ditt.

Flere sammenligningstester

Hvis du finner ut at det er en betydelig forskjell mellom gruppene som ikke er relatert til samplingsfeil, er det nødvendig å kjøre flere t-tester for å teste midlene mellom gruppene. Det er utført flere tester for å kontrollere feilhastigheten av type 1.

  • Scheffes test
  • Endret Bonferroni-test
  • Dunnettes test
  • Tukey's test

beregninger

ANOVA-beregninger kan gjøres på tre måter - Håndberegninger, Excel-ark og SPSS-programvare. La oss lære om alle beregningene i detalj nedenfor

  1. ANOVA håndberegninger

  • Trinn 1

Beregn CM

CM = (Totalt av alle observasjoner) 2 / N Totalt

  • Steg 2

Beregn total SS

Totalt SS = Summen av kvadrater av alle observasjoner - CM

  • Trinn 3

Beregn SST (Sum av kvadrater for behandling)

SST = ∑ 3 i = 1 T2i / n i - CM

  • Trinn 4

Beregn SSE (Sum av kvadrater for feil)

SSE = SS (totalt) - SST

  • Trinn 5

Beregn MST, MSE og deres forhold F

MST = SST / k-1

MSE = SSE / Nk

F = MST / MSE

  1. ANOVA bruker Excel

Følg disse enkle trinnene for å utføre en enkeltfaktor ANOVA i Excel

  • Gå til Data-fanen
  • Klikk på Dataanalyse
  • Velg Anova: Enkel faktor og klikk Ok (det er også andre alternativer som Anova: to faktor med replikasjon og Anova: to faktor uten replikering)
  • Klikk på Input Range-boksen og velg området
  • Klikk på Output Range-boksen, velg output range og klikk OK
  • Du vil få resultatet vist i excelarket
  • Hvis F er større enn F crit, blir nullhypotesen avvist
  1. ANOVA bruker SPSS

Last ned først SPSS-programvaren for å utføre ANOVA. Her kan vi se hvordan du utfører en Enveis ANOVA ved hjelp av SPSS

SPSS antar alltid at den uavhengige variabelen er representert numerisk. I eksempeldatasettet er MAJOR en streng. Så konverter først strengvariabelen til en numerisk variabel. Når konverteringen er over er du klar til å gjøre ANOVA

  • Åpne SPSS-programvaren
  • Klikk på Analyser à Sammenlign midler à enveis ANOVA
  • En måte ANOVA-dialogboksen vises på skjermen
  • På venstre side av dialogboksen vil du se en liste over alle de avhengige variablene som ble målt av deg. Flytt den inn i Avhengig-listen på høyre side ved å bruke den øverste pilknappen
  • Flytt på samme måte den uavhengige variabelen i venstre sideliste til Faktor-boksen på høyre side.
  • Klikk på Post Hoc-knappen for å velge typen sammenligning du vil gjøre.
  • Velg en Post hoc-test som passer for din forskning ved å klikke i avmerkingsboksen ved siden av testen
  • Klikk på Fortsett, og den tar deg til dialogboksen ANOVA på én måte
  • Velg statistikk og klikk på avmerkingsboksene til venstre for alternativet for å velge den
  • Klikk på Means plot for å få en anova-graf over betingelsene
  • Klikk på Fortsett og klikk OK

SPSS-utgangsvindu vil vises med seks hoveddeler

  • Beskrivende seksjon
  • Test of Homogenitet of Variances
  • ANOVA
  • Flere sammenligninger
  • Karakterpoeng gjennomsnitt
  • Kurve

Ting du må vurdere når du kjører en ANOVA

Datanivå og forutsetninger spiller en avgjørende rolle i ANOVA.

Forskeren skal finne ut om dataene er krysset eller nestet. Hvis dataene krysses, mottar alle grupper alle aspekter.

Hvis dataene er nestet, vil hver gruppe motta en annen ANOVA-metode.

Det er viktigere å beregne størrelsen på anova-effekten. Effektstørrelsen kan fortelle deg i hvilken grad nullhypotesen er falsk. En middels effektstørrelse er alltid å foretrekke

Håper denne artikkelen ga deg en kort oversikt over ANOVA og tolke resultater ved å bruke den.

Relaterte kurs: -

  1. ANOVA Bruker Minitab
  2. R Studio Anova Techniques Course

Kategori: