Introduksjon til uovervåket maskinlæring

Har du noen gang tenkt på hvordan et barn er i stand til å skille mellom epler og appelsiner når han ikke vet hva de faktisk er, hvordan de smaker, men basert på farge og størrelse kan han dele dem i to grupper uten forhåndsinformasjon? Kan vi forvente den samme segmenteringen som et barn gjør fra maskiner hvis informasjonen om farge og størrelse blir gitt? La oss se hvordan vi kan gjøre det! I dette emnet skal vi lære om maskinell læring uten sikkerhet.

"Maskinlæring" slik begrepet antyder at vi lærer maskiner å utføre menneskelignende oppgaver og hvordan lærer mennesker, enten fra noen eller ved observasjon. Samme som mennesker, slik maskinen lærer.

Maskinlæring kan deles inn i tre deler: -

  1. Veiledet læring
  2. Uovervåket læring
  3. Forsterkningslæring

Typer maskinlæring

Forsterkningslæring er agentbasert læring som innebærer belønning og straff ved handlinger utført av en agent. Endelig mål er å maksimere den samlede belønningen i prosessen med å lære av miljøet.

Når du har input-output data, kan kort sagt merkede data for eksempel gitt høyde og vekt for å bestemme om en person er mann eller kvinne betraktes som en veiledet læringsoppgave (fra noen når det gjelder mennesker).

Men i mange virkelige scenarier er ikke disse merkede eller kommenterte dataene tilgjengelige. Mange ganger møter vi problemer med å segmentere objekter basert på deres egenskaper som ikke eksplisitt er nevnt. Hvordan løse dette problemet? Vel, uovervåket læring er løsningen.

Wikipedia sier at uovervåket læring er en type selvorganisert hebbisk læring som hjelper med å finne tidligere ukjente mønstre i datasettet uten eksisterende etiketter. I uovervåket læring har vi ingen informasjon om etiketten, men vi ønsker å få innsikt fra dataene basert på de forskjellige egenskapene.

Typer av uovervåket maskinlæring

Uovervåkte læringsoppgaver kan stort sett deles inn i tre kategorier:

  1. Foreningsregel gruvedrift
  2. Gruppering
  3. Anbefalingssystem

1. Foreningens regelverksdrift

Når vi har transaksjonsdata for noe, kan det være for produkter som selges eller transaksjonsdata for det som betyr noe, vil jeg vite, er det noe skjult forhold mellom kjøper og produktene eller produkt til produkt, slik at jeg på en eller annen måte kan utnytte denne informasjonen å øke salget mitt. Å trekke ut disse forholdene er kjernen i Association Rule Mining. Vi kan bruke vekstalgoritmer AIS, SETM, Apriori, FP for å trekke ut relasjoner.

2. Clustering

Clustering kan gjøres alle data der vi ikke har informasjon om klassen eller etiketten. Vi ønsker å gruppere dataene slik at observasjonene med lignende egenskaper tilhører den samme klyngen / gruppen og avstand mellom klyngen skal være maksimal. Mens avstand mellom klynger bør være minimum. Vi kan gruppere velgerens data for å finne ut mening om regjeringen, eller klyngeprodukter, basert på deres funksjoner og bruk. Segmentpopulasjon basert på inntektsfunksjoner eller bruk gruppering i salg og markedsføring.

Vi kan bruke K-Means, K-Means ++, K-Medoids, Fuzzy C-middel (FCM),

Expectation-Maximization (EM), Agglomerative Clustering, DBSCAN, typer hierarchical Clustering som enkeltkobling, fullstendig kobling, median linkage, Ward's metodealgoritmer for clustering.

3. Anbefalingssystem

Anbefalingssystem er i utgangspunktet en utvidelse av Association mining mining i den forstand, i ARM trekker vi ut forhold, og i anbefalingssystem bruker vi disse forholdene for å anbefale noe som har høyere akseptsjanser av sluttbrukeren. Anbefalingssystemer har vunnet popularitet etter at Netflix kunngjorde en stor premie på 1.000.000 dollar i 2009.

Anbefalingssystemer fungerer på transaksjonelle data, det være seg økonomisk transaksjon, e-handel eller dagligvarebutikk. I dag lokker gigantiske aktører i e-handelsbransjen kunder ved å lage en tilpasset anbefaling for hver bruker basert på deres tidligere kjøpshistorikk og lignende kjøpsdata for oppførsel fra andre brukere.

Metoder for å utvikle anbefalingssystemer kan bredt deles inn i samarbeidsfiltrering og innholdsbasert filtrering. I samarbeidsfiltrering igjen har vi bruker-bruker Collaborative filtrering og Item-Item Collaborative filtering som er minnebaserte tilnærminger & Matrix factorization and Singular Value Decomposition (SVD) er modellbaserte tilnærminger.

Bruksområder for uovervåket læring

Ettersom verdens data øker voldsomt hver dag, har uovervåket læring mange bruksområder. Vi lager alltid data ved å bruke sosiale medier-plattformer eller videoinnhold på YouTube, og mange ganger gjør vi det ikke med vilje. Alle disse dataene er ustrukturerte, og det vil være slitsomt og dyrt å merke dem for veiledte læringsoppgaver.

Følgende er noen kule bruksområder for maskinlæring uten tilsyn.

  1. Dagligvarebutikk eller e-handelsbutikk / markedsplass: Extract Association regler fra kundens transaksjonsdata og anbefalinger for forbrukere om å kjøpe produkter.
  2. Plattform for sosiale medier: Trekk ut forhold til forskjellige brukere for å foreslå produkter eller tjenester. Anbefaler nye mennesker for sosial kontakt.
  3. Tjenester: Anbefalinger av reisetjenester, en anbefaling av hus å leie, eller matchmaking-tjenester.
  4. Banking: Clusterkunder basert på deres økonomiske transaksjoner. Cluster-falske transaksjoner for funn av svindel
  5. Politikk: Clustervelgers meninger om sjansene for en seier for et bestemt parti.
  6. Datavisualisering: Med gruppering og t-distribuert Stokastisk nabobygging (t-SNE) kan vi visualisere høydimensjonale data. Dette kan også brukes til dimensjonalitetsreduksjon.
  7. Underholdning: Anbefalinger for filmer, musikk, som Netflix og Amazon gjør.
  8. Bildesegmentering: Cluster bilder deler basert på nærmeste pikselverdier.
  9. Innhold: personaliserte aviser, anbefalinger fra websider, e-læringsapplikasjoner og e-postfiltre.
  10. Strukturell oppdagelse: Med klynger kan vi oppdage enhver skjult struktur i dataene. Cluster twitter-data for sentimentanalyse.

Konklusjon

Uovervåket maskinlæring er ikke for kvantifiserbar, men kan løse mange problemer der overvåkede algoritmer mislykkes. Det er mange applikasjoner for uovervåket læring i mange domener der vi har ustrukturerte og umerkede data. Vi kan bruke uovervåket læringsteknikker for å lære maskinene våre å gjøre en bedre jobb enn oss. De siste årene har maskiner overgått mennesker i forhold til oppgaver som anses å være løst av mennesker i århundrer. Jeg håper at du med denne artikkelen forsto hva som er og hvordan uovervåket maskinlæringsteknikker kan brukes til å løse problemer i den virkelige verden.

Anbefalte artikler

Dette er en guide til uovervåket maskinlæring. Her diskuterer vi hvilke typer maskinlæring og typer maskinellæring uten tilsyn sammen med bruksområdene. Du kan også se på følgende artikler for å lære mer -

  1. Maskinlæringsalgoritmer
  2. Hva er maskinlæring?
  3. Introduksjon til maskinlæring
  4. Machine Learning Tools
  5. Clustering in Machine Learning
  6. Hyperparameter maskinlæring
  7. Hierarkisk Clustering Algorithm
  8. Hierarkisk klynging | Agglomerative & Divisive Clustering
  9. Topp 8 stadier i maskinlæring livssyklus

Kategori: