Multivariat regresjon - Eksempler på multivariat regresjon

Innholdsfortegnelse:

Anonim

Introduksjon til multivariat regresjon

  • Begrepet i multivariat betyr modell med mer enn en variabel
  • Multivariat regresjon er en del av multivariat statistikk.
  • Multivariat regresjon er en teknikk som brukes til å estimere en enkelt regresjonsmodell når det er mer enn en utfallsvariabel.
  • Multivariat regresjon har ofte brukt en maskinlæringsalgoritme som er en Supervised Learning-algoritme.

Hvorfor en enkelt regresjonsmodell ikke vil fungere?

  • Som kjent er regresjonsanalyse hovedsakelig brukt til å utforske forholdet mellom en avhengig og uavhengig variabel.
  • I den virkelige verden er det mange situasjoner der mange uavhengige variabler er innflytelsesrike av andre variabler for at vi må flytte til forskjellige alternativer enn en enkelt regresjonsmodell som bare kan ta en uavhengig variabel.

Hva er multivariat regresjon?

  • Multivariat regresjon hjelper bruken til å måle vinkelen til mer enn en uavhengig variabel og mer enn en avhengig variabel. Den finner sammenhengen mellom variablene (Lineært beslektet).
  • Det brukes til å forutsi atferden til utfallsvariabelen og assosiasjonen til prediktorvariabler og hvordan prediktorvariablene endres.
  • Det kan brukes på mange praktiske felt som politikk, økonomi, medisinsk, forskningsarbeid og mange forskjellige typer virksomheter.
  • Multivariat regresjon er en enkel utvidelse av multippel regresjon.
  • Flere regresjoner brukes til å forutsi og utveksle verdiene til en variabel basert på den samlede verdien av mer enn en verdi av prediktorvariablene.
  • Først vil vi ta et eksempel for å forstå bruken av multivariat regresjon etter at vi vil se etter løsningen på det problemet.

Eksempler på multivariat regresjon

  • Hvis netthandelsselskapet har samlet inn dataene til sine kunder som alder, vil kjøpte historier om en kunde, kjønn og selskap finne forholdet mellom disse forskjellige forsørgerne og uavhengige variabler.
  • En treningsstudio har samlet inn dataene til sin klient som kommer til treningsstudioet sitt og ønsker å observere noen ting hos klienten som er helse, spisevaner (hvilken type produktklient som bruker hver uke), klientens vekt. Dette ønsker å finne en sammenheng mellom disse variablene.

Som du har sett i de to eksemplene ovenfor, at det i begge situasjonene er mer enn en variabel, noen er avhengige og noen er uavhengige, så enkelt regresjon er ikke nok til å analysere denne typen data.

Her er den multivariate regresjonen som kommer inn i bildet.

1. Valg av funksjon -

Valg av funksjoner spiller den viktigste rollen i multivariat regresjon.

Finne funksjonen som er nødvendig for å finne hvilken variabel som er avhengig av denne funksjonen.

2. Normaliseringsfunksjoner -

For bedre analyse må funksjoner skaleres for å få dem inn i et bestemt område. Vi kan også endre verdien på hver funksjon.

3. Velg Tap-funksjon og hypotese -

Tapsfunksjonen beregner tapet når hypotesen spår feil verdi.

Og hypotese betyr forutsagt verdi fra funksjonsvariabelen.

4. Angi hypoteseparametere -

Still inn hypoteseparameteren som kan redusere tapsfunksjonen og kan forutsi.

5. Minimer tapsfunksjonen-

Minimerer tapet ved å bruke noen miste minimeringsalgoritmer og bruke det over datasettet som kan bidra til å justere hypoteseparametrene. Når tapet er minimert, kan det brukes til prediksjon.

Det er mange algoritmer som kan brukes til å redusere tapet, for eksempel gradient nedstigning.

6. Test hypotesefunksjonen -

Sjekk hypotesefunksjonen hvor korrekt den forutsier verdier, test den på testdata.

Trinn for å følge arkiv multivariat regresjon

1) Importer de nødvendige vanlige bibliotekene som numpy, pandaer

2) Les datasettet ved hjelp av panda-biblioteket

3) Som vi har diskutert ovenfor, må vi normalisere dataene for å få bedre resultater. Hvorfor normalisering fordi hver funksjon har et annet verdiområde.

4) Lag en modell som kan arkivere regresjon hvis du bruker lineær regresjonsbruk

Y = mx + c

I hvilken x gis inngang, er m en stigningslinje, c er konstant, y er utgangsvariabelen.

5) Tren modellen ved å bruke hyperparameter. Forstå hyperparameteret som er angitt i henhold til modellen. Slik som læringsfrekvens, epoker, iterasjoner.

6) Som diskutert ovenfor hvordan hypotesen spiller en viktig rolle i analysen, sjekker hypotesen og måler taps / kostnadsfunksjonen.

7) Taps- / kostnadsfunksjonen vil hjelpe oss å måle hvordan hypoteseverdien er sann og nøyaktig.

8) Minimer tap / kostnad-funksjonen vil hjelpe modellen med å forbedre prediksjonen.

9) Tapslikningen kan defineres som en sum av den kvadratiske forskjellen mellom den forutsagte verdien og den faktiske verdien delt på dobbelt så stort som datasettet.

10) For å minimere tap / kostnad-funksjonen ved å bruke gradientavstigning, starter den med en tilfeldig verdi og finner poenget med at tapsfunksjonen er minst.

Ved å følge ovenstående kan vi implementere multivariat regresjon

Fordeler med multivariat regresjon

  • Den multivariate teknikken gjør det mulig å finne et forhold mellom variabler eller funksjoner
  • Det hjelper å finne en sammenheng mellom uavhengige og avhengige variabler.

Fordeler med multivariat regresjon

  • Multivariate teknikker er en litt kompleks og matematisk beregning på høyt nivå
  • Den multivariate regresjonsmodellens utgang er ikke lett å tolke, og noen ganger fordi en del tap og feilutgang ikke er identiske.
  • Det kan ikke brukes på et lite datasett fordi resultatene er mer enkle i større datasett.

Konklusjon - multivariat regresjon

  • Hovedhensikten med å bruke multivariat regresjon er når du har mer enn én variabler er tilgjengelige, og i så tilfelle vil en enkelt lineær regresjon ikke fungere.
  • Hovedsakelig har den virkelige verden flere variabler eller funksjoner når flere variabler / funksjoner kommer i spill multivariat regresjon brukes.

Anbefalte artikler

Dette er en guide til den multivariate regresjonen. Her diskuterer vi introduksjonen, eksempler på multivariat regresjon sammen med fordelene og fordelene. Du kan også gå gjennom andre foreslåtte artikler for å lære mer -

  1. Regresjonsformel
  2. Data Science Course i London
  3. SAS-operatører
  4. Datavitenskapsteknikker
  5. Variabler i JavaScript
  6. Topp forskjeller av regresjon vs klassifisering