Introduksjon til Supervised Learning og Unsupervised Learning

Veiledet læring og Uovervåket læring er maskinlæringsoppgaver.
Veiledet læring er ganske enkelt en prosess for å lære algoritme fra opplæringsdatasettet. Veiledet læring er der du har inngangsvariabler og en utgangsvariabel, og du bruker en algoritme for å lære kartleggingsfunksjonen fra inngangen til utdataene. Målet er å tilnærme kartleggingsfunksjonen slik at når vi har nye inndata, kan vi forutsi utgangsvariablene for de dataene.

Uovervåket læring modellerer den underliggende eller skjulte strukturen eller distribusjonen i dataene for å lære mer om dataene. Uovervåket læring er der du bare har inndata og ingen tilsvarende utgangsvariabler.

Opplæringsdatasett: Et sett eksempler brukt til læring, der målverdien er kjent.

Sammenligning mellom hodet og hodet mellom Supervised Learning vs Unsupervised Learning (Infographics)

Nedenfor er topp 7-sammenligningen mellom veiledet læring og uovervåket læring

Viktige forskjeller mellom Supervised Learning vs Unsupervised Learning

Nedenfor er listene over punkter, som beskriver de viktigste forskjellene mellom Supervised Learning vs Unsupervised Learning

1. Algoritmer til maskinlæring oppdager mønstre i big data. Disse forskjellige algoritmene kan klassifiseres i to kategorier basert på måten de "lærer" om data for å gjøre forutsigelser. Disse er veiledet og uten tilsyn.

2. I veiledet lærer forsker fungerer som en guide for å lære algoritmen hvilke konklusjoner eller spådommer den bør komme med. I uovervåket læring er det ikke noe riktig svar, det er ingen lærer, algoritmer overlates til sine egne for å oppdage og presentere den interessante skjulte strukturen i dataene.

3. Veiledet læringsmodell vil bruke treningsdataene til å lære en kobling mellom innspill og utganger.

4. Uovervåket læring bruker ikke utdata. I uovervåket læring vil de ikke være merket forkunnskap, mens læring under veiledet vil ha tilgang til etikettene og ha forkunnskaper om datasettene.

5. Veiledet læring: Tanken er at trening kan generaliseres og at modellen kan brukes på nye data med en viss nøyaktighet.

6. Veiledede læringsalgoritmer: Støttvektormaskin, Lineær og logistikkregresjon, nevralt nettverk, klassifiseringstrær og tilfeldig skog etc.

7. Uovervåkte algoritmer kan deles inn i forskjellige kategorier: Klyngealgoritmer, K-midler, Hierarkisk klynging, dimensjonsreduksjonsalgoritmer, Anomalideteksjoner, etc.

8. Klassifiserings- og regresjonsområde mye brukte algoritmer i veiledet læring. Support Vector Machines (SVM) er overvåkede maskinlæringsmodeller med tilhørende læringsalgoritmer, de kan brukes til både klassifiserings- og regresjonsformål, men mest brukt til klassifiseringsproblemer.

9.I SVM-modell plotter vi hvert dataelement som et punkt i n-dimensjonalt rom, (der n er funksjoner vi har), med verdiene til hver funksjon som verdien av en bestemt koordinat. Deretter utføres klassifiseringen ved å finne hyperplanet som skiller de to klassene.

10.Hovedmålet med regresjonsalgoritmer er å forutsi den diskrete eller fortsette verdien. I noen tilfeller kan den forutsagte verdien brukes til å identifisere det lineære forholdet mellom attributtene. Basert på problemforskjellen kan regresjonsalgoritmer brukes. Noen av de grunnleggende regresjonsalgoritmene er lineær regresjon, polynomial regresjon, etc.

11.Sluttring er mye brukt i uovervåket læring. Clustering er oppgaven med å dele datapunktene i antall grupper slik at de samme trekkpunktene vil være sammen i form av klynge. Det er flere mange grupperingsalgoritmer; få av dem er tilkoblingsmodeller, centroidmodeller, distribusjonsmodeller og tetthetsmodeller.

12.Hierarkisk klynging er under uovervåket læring. Hierarkisk klynging, som navnet antyder, er en algoritme som bygger hierarki av klynger. Denne algoritmen starter med alle datapunktene som er tilordnet en egen klynge. Deretter slås to nærmeste klynger sammen til den samme klyngen. Til slutt avsluttes denne algoritmen når det bare er en enkelt klynge igjen.

13.KMeans kommer under ikke-overvåket klyngemetode. Data blir delt inn i k klynger, basert på funksjonene deres. Hver klynge er representert med sin sentriske del, definert som sentrum for punktene i klyngen. KMeans er enkelt og raskt, men det gir ikke samme resultat med hver kjøring.

14. For å forstå veiledet læring og uovervåket læring bedre, la oss ta eksempler fra det virkelige liv. Overvåket læring: La oss ta en av Gmail-funksjonalitet som et eksempel, som er en spam-post. Basert på tidligere informasjon om spam-e-poster, filtrerer du ut en ny innkommende e-post i innboksmappen eller søppelmappen. I dette scenariet er Gmail modellert som en kartleggingsfunksjon for å adskille den innkommende e-posten basert på forkunnskaper om postene, dette er overvåket læring.

15. Overvåket læring: La oss anta at en venn inviterer deg til festen hennes, der du møter nye mennesker. Nå klassifiserer du dem uten bruk av forkunnskaper (Unsupervised learning), og denne klassifiseringen kan være på en hvilken som helst egenskap. Det kan være aldersgruppe, kjønn, påkledning, utdanningskvalifikasjon eller hva du enn vil. Siden du ikke brukte noen forkunnskaper om mennesker og klassifiserte dem, kommer det under uovervåket læring.

Sammenlignet tabell med veiledet læring kontra ikke-overvåket læring

Veiledet læringUovervåket læring

Metode

Inngangsvariabler og utgangsvariabler vil bli gitt.Bare inndata blir gitt

Mål

Overvåket læringsmål er å bestemme funksjonen så godt at når nye inndatasett som er gitt, kan forutsi utgangen.Det uovervåkte læringsmålet er å modellere de skjulte mønstrene eller den underliggende strukturen i de gitte inputdataene for å lære om dataene.

Klasse

Problemer med maskinlæring, datamining og nevrale nettverk,Læring av maskiner, datadrift, problemer og nevrale nettverk

eksempler

  • Klassifisering
  • regresjon
  • Lineær regresjon
  • Støtt vektormaskin
  • Gruppering
  • assosiasjon
  • k-anordning
  • assosiasjon
Hvem brukerData forskereData forskere

Økosystemer

Big data Behandling, Data mining osv

Big data Behandling, Data mining osv

Bruker

Overvåket læring brukes ofte til eksportsystemer innen bildegjenkjenning, talegjenkjenning, prognoser, økonomisk analyse og opplæring av nevrale nettverk og beslutningstrær osv

Ikke-overvåkte læringsalgoritmer brukes til å forhåndsbehandle dataene, under utforskende analyse eller for å trene overvåkte læringsalgoritmer.

Konklusjon - Supervised Learning vs Unsupervised Learning

Valg av å bruke en overvåket eller uovervåket maskinlæringsalgoritme avhenger vanligvis av faktorer relatert til strukturen og volumet til dataene dine og bruksaken. I virkeligheten bruker dataforskere både Supervised Learning og Unsupervised Learning-tilnærminger sammen for å løse brukssaken.

Anbefalt artikkel

Dette har vært en guide til Supervised Learning vs Unsupervised Learning, deres betydning, sammenligning mellom hodet og hodet, nøkkelforskjeller, sammenligningstabell og konklusjon. Du kan også se på følgende artikler for å lære mer -

  1. Beste 7 sammenligningen mellom veiledet læring og forsterket læring
  2. 5 Mest nyttige forskjellen mellom datavitenskap og maskinlæring
  3. Lær den 10 beste forskjellen mellom kart redusere vs garn
  4. MapReduce vs Apache Spark- 20 nyttige sammenligninger å lære
  5. Hva er forsterkningslæring?

Kategori: