Oversikt over Two Way ANOVA i R

Toveis ANOVA (Analysis of Variance) hjelper oss å forstå forholdet mellom en kontinuerlig avhengig variabel og to kategoriske uavhengige variabler. I dette emnet skal vi lære om Two Way ANOVA i R.

Nedenfor er hypotesen om interesse under toveis ANOVA

  1. H₀: Kall det hovedeffekten som er den første faktoren som er avhengig av den kontinuerlige variabelen
  2. H₀: Hovedeffekten handler også om effekten på den andre variabelen på den avhengige kontinuerlige variabelen.
  3. H₀: Interaksjon er den kombinerte effekten av både den første, den andre faktor-variabelen på den avhengige variabelen

Nedenfor er normene som en toveis ANOVA må tilfredsstille.

  1. Observasjoner må være uavhengige
  2. Observasjoner skal normalt distribueres.
  3. Det bør være lik varians i observasjonene
  4. Ingen designere
  5. Feil skal være uavhengige.

Merk

Vi må transformere dataene våre hvis normalitet og lik varians krenkes.

Eksempel på Two Way ANOVA i R

La oss utføre en måte ANOVA-test på datasett for kreftnivåer som inneholder 48 rader og 3 datavariabler:

Tid tatt: Overlevelsestid for et dyr

Ulike nivåer av kreft 1 - 3

Behandling: Behandlinger brukt fra 1-3

Før vi tester, trenger vi følgende data.

  • Importerer dataene
  • Fjern unødvendig variabel
  • Konverter variabler (nivåer av kreft) som bestilt nivå.

Nedenfor er datasettet.

Observasjoner: 48

Variabler: 3

tid for overlevelse 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0 …

kreftnivå 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …

Behandling A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Mål

  1. H₀: ingen endring i gjennomsnittlig overlevelsestid mellom gruppe
  2. H₀: overlevelsestid er forskjellig for minst en gruppe.

Steps

  • Sjekk kreftnivået. Vi kan se tre karakterverdier fordi vi konverterer dem til faktorer med et mutert verb.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Beregn både gjennomsnitt og standardavvik

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Produksjon:

En tibble: 3 x 4

cancerlevels count_cancerlevels mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0.544375 0.28936641

3 3 16 0, 276250 0, 06227627

  • I trinn tre kan du grafisk sjekke om det er en forskjell mellom distribusjonene. Legg merke til at du inkluderer den jitterte prikken.
  • Kjør test med kommando AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

syntaks:

y ~ X1 + X2 +… + Xn (X1 + X2 +… refererer til de uavhengige variablene)

y ~. Bruk alle de gjenværende variablene som uavhengige variabler

Forsikre deg om at du lagrer modellen og skriver ut sammendraget.

Kode

  • aov (tid ~ kreftnivå, data = df): Kjør ANOVA-testen med følgende formel
  • sammendrag (anova_one_way): Skriv ut sammendraget av testen

Df Sum Sq Gjennomsnitt Sq F-verdi Pr (> F)

Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***

Residualer 45 1.972 0, 0438

-

Signif. koder: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0, 1 '' 1

P-verdien er lavere enn terskelen 0, 05. Den statistiske forskjellen er indikert med '*' i ovennevnte tilfelle.

One Way Test to Two Way Anova i R

La oss se hvordan enveis-testen kan utvides til toveis ANOVA. Testen er lik enveis ANOVA, men formelen skiller seg og legger til en annen gruppevariabel til formelen.

y = x1 + x2

  • H0 : Midlene er like for begge variablene (faktorvariabler)
  • H3 : Midlene er forskjellige for begge variablene

Du legger til behandlingsvariabler i modellen vår. Denne variabelen indikerer behandlingen gitt til pasienten. Du er interessert i å se om det er en statistisk avhengighet mellom kreftnivået og behandlingen som gis til pasienten.

Vi justerer koden vår ved å legge til en godbit med den andre uavhengige variabelen.

Df Sum Sq Gjennomsnitt Sq F-verdi Pr (> F)

Kreftnivå 2 1.0330 0.5165 20.64 5.7e-07 ***

Behandle 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***

Residualer 42 1.0509 0, 0250

Både kreftnivå og behandling er statistisk forskjellig fra 0. Ved dette kan vi avvise NULL-hypotesen. Bekreft også at å endre behandling eller type kreft påvirker overlevelsestiden.

Test

Enveis ANOVA: H3- Gjennomsnittet er forskjellig for minst en gruppe

To-veis ANOVA: H3- Gjennomsnittet er forskjellig for begge gruppene.

Forskjellen mellom enveis og toveis ANOVA

Forskjeller mellom enveis ANOVA og toveis ANOVA

Enveis ANOVATo-veis ANOVA
Designet for å muliggjøre likestillingstesting mellom tre eller flere midlerDesignet for å vurdere sammenhengen mellom to uavhengige variabler på en avhengig variabel.
Involverer en uavhengig variabelInvolverer to uavhengige variabler
Analysert i 3 eller flere kategoriske grupper.Sammenligner flere grupper med to faktorer
Må tilfredsstille to prinsipper - replikering og randomiseringMå tilfredsstille tre prinsipper som er replikering, randomisering og lokal kontroll.

Fordeler med toveis ANOVA

  • I eksemplet over hjelper alder og kjønn i eksempelet vårt - å redusere feilvariasjon, noe som gjør designet mer effektivt.
  • Toveis ANOVA gjør det mulig for oss å teste effekten av to faktorer samtidig.

Søknader fra ANOVA

  1. Sammenligner kjørelengden til forskjellige kjøretøyer, drivstoff og veityper.
  2. Bli kjent med påvirkningen av temperatur, trykk eller kjemisk konsentrasjon på en eller annen kjemisk reaksjon (kraftreaktorer, kjemiske anlegg osv.)
  3. Effekten av forskjellige katalysatorer på kjemiske reaksjonshastigheter
  4. Forstå virkningen av reklamefilmer og forskjellige antall kundersvar.
  5. Effekt av ytelse, kvalitet og hastighetsproduksjon i biologi (prosess basert på antall celler de blir delt inn i)

Anbefalte artikler

Dette er en guide til Toveis ANOVA i R. Her diskuterer vi eksempler, mål, trinn og forskjell mellom Enveis og toveis ANOVA. Du kan også se på følgende artikler for å lære mer -

  1. ANOVA i R
  2. Hvordan tolke resultater ved bruk av ANOVA-test
  3. Regresjon vs ANOVA
  4. GLM i R

Kategori: