Oversikt over Two Way ANOVA i R
Toveis ANOVA (Analysis of Variance) hjelper oss å forstå forholdet mellom en kontinuerlig avhengig variabel og to kategoriske uavhengige variabler. I dette emnet skal vi lære om Two Way ANOVA i R.
Nedenfor er hypotesen om interesse under toveis ANOVA
- H₀: Kall det hovedeffekten som er den første faktoren som er avhengig av den kontinuerlige variabelen
- H₀: Hovedeffekten handler også om effekten på den andre variabelen på den avhengige kontinuerlige variabelen.
- H₀: Interaksjon er den kombinerte effekten av både den første, den andre faktor-variabelen på den avhengige variabelen
Nedenfor er normene som en toveis ANOVA må tilfredsstille.
- Observasjoner må være uavhengige
- Observasjoner skal normalt distribueres.
- Det bør være lik varians i observasjonene
- Ingen designere
- Feil skal være uavhengige.
Merk
Vi må transformere dataene våre hvis normalitet og lik varians krenkes.
Eksempel på Two Way ANOVA i R
La oss utføre en måte ANOVA-test på datasett for kreftnivåer som inneholder 48 rader og 3 datavariabler:
Tid tatt: Overlevelsestid for et dyr
Ulike nivåer av kreft 1 - 3
Behandling: Behandlinger brukt fra 1-3
Før vi tester, trenger vi følgende data.
- Importerer dataene
- Fjern unødvendig variabel
- Konverter variabler (nivåer av kreft) som bestilt nivå.
Nedenfor er datasettet.
Observasjoner: 48
Variabler: 3
tid for overlevelse 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …
kreftnivå 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Behandling A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Mål
- H₀: ingen endring i gjennomsnittlig overlevelsestid mellom gruppe
- H₀: overlevelsestid er forskjellig for minst en gruppe.
Steps
- Sjekk kreftnivået. Vi kan se tre karakterverdier fordi vi konverterer dem til faktorer med et mutert verb.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Beregn både gjennomsnitt og standardavvik
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Produksjon:
En tibble: 3 x 4
cancerlevels count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0.544375 0.28936641
3 3 16 0, 276250 0, 06227627
- I trinn tre kan du grafisk sjekke om det er en forskjell mellom distribusjonene. Legg merke til at du inkluderer den jitterte prikken.
- Kjør test med kommando AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
syntaks:
y ~ X1 + X2 +… + Xn (X1 + X2 +… refererer til de uavhengige variablene)
y ~. Bruk alle de gjenværende variablene som uavhengige variabler
Forsikre deg om at du lagrer modellen og skriver ut sammendraget.
Kode
- aov (tid ~ kreftnivå, data = df): Kjør ANOVA-testen med følgende formel
- sammendrag (anova_one_way): Skriv ut sammendraget av testen
Df Sum Sq Gjennomsnitt Sq F-verdi Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Residualer 45 1.972 0, 0438
-
Signif. koder: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0, 1 '' 1
P-verdien er lavere enn terskelen 0, 05. Den statistiske forskjellen er indikert med '*' i ovennevnte tilfelle.
One Way Test to Two Way Anova i R
La oss se hvordan enveis-testen kan utvides til toveis ANOVA. Testen er lik enveis ANOVA, men formelen skiller seg og legger til en annen gruppevariabel til formelen.
y = x1 + x2
- H0 : Midlene er like for begge variablene (faktorvariabler)
- H3 : Midlene er forskjellige for begge variablene
Du legger til behandlingsvariabler i modellen vår. Denne variabelen indikerer behandlingen gitt til pasienten. Du er interessert i å se om det er en statistisk avhengighet mellom kreftnivået og behandlingen som gis til pasienten.
Vi justerer koden vår ved å legge til en godbit med den andre uavhengige variabelen.
Df Sum Sq Gjennomsnitt Sq F-verdi Pr (> F)
Kreftnivå 2 1.0330 0.5165 20.64 5.7e-07 ***
Behandle 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Residualer 42 1.0509 0, 0250
Både kreftnivå og behandling er statistisk forskjellig fra 0. Ved dette kan vi avvise NULL-hypotesen. Bekreft også at å endre behandling eller type kreft påvirker overlevelsestiden.
Test
Enveis ANOVA: H3- Gjennomsnittet er forskjellig for minst en gruppe
To-veis ANOVA: H3- Gjennomsnittet er forskjellig for begge gruppene.
Forskjellen mellom enveis og toveis ANOVA
Forskjeller mellom enveis ANOVA og toveis ANOVA
Enveis ANOVA | To-veis ANOVA |
Designet for å muliggjøre likestillingstesting mellom tre eller flere midler | Designet for å vurdere sammenhengen mellom to uavhengige variabler på en avhengig variabel. |
Involverer en uavhengig variabel | Involverer to uavhengige variabler |
Analysert i 3 eller flere kategoriske grupper. | Sammenligner flere grupper med to faktorer |
Må tilfredsstille to prinsipper - replikering og randomisering | Må tilfredsstille tre prinsipper som er replikering, randomisering og lokal kontroll. |
Fordeler med toveis ANOVA
- I eksemplet over hjelper alder og kjønn i eksempelet vårt - å redusere feilvariasjon, noe som gjør designet mer effektivt.
- Toveis ANOVA gjør det mulig for oss å teste effekten av to faktorer samtidig.
Søknader fra ANOVA
- Sammenligner kjørelengden til forskjellige kjøretøyer, drivstoff og veityper.
- Bli kjent med påvirkningen av temperatur, trykk eller kjemisk konsentrasjon på en eller annen kjemisk reaksjon (kraftreaktorer, kjemiske anlegg osv.)
- Effekten av forskjellige katalysatorer på kjemiske reaksjonshastigheter
- Forstå virkningen av reklamefilmer og forskjellige antall kundersvar.
- Effekt av ytelse, kvalitet og hastighetsproduksjon i biologi (prosess basert på antall celler de blir delt inn i)
Anbefalte artikler
Dette er en guide til Toveis ANOVA i R. Her diskuterer vi eksempler, mål, trinn og forskjell mellom Enveis og toveis ANOVA. Du kan også se på følgende artikler for å lære mer -
- ANOVA i R
- Hvordan tolke resultater ved bruk av ANOVA-test
- Regresjon vs ANOVA
- GLM i R