Forskjellen mellom data science og data mining
Data Mining handler om å finne trendene i et datasett. Og bruke disse trendene for å identifisere fremtidige mønstre. Det er et viktig trinn i Knowledge Discovery-prosessen. Det inkluderer ofte å analysere den store mengden historiske data som tidligere ble ignorert. Data Science er et studieretning som inkluderer alt fra Big Data Analytics, Data Mining, prediktiv modellering, Data visualisering, matematikk og statistikk. Data Science har blitt referert til som det fjerde paradigmet av vitenskap. (de tre andre er teoretisk, empirisk og beregningsmessig). Akademia driver ofte eksklusiv forskning innen datavitenskap.
Historisk perspektiv
Før vi går over til de tekniske beskrivelsene, la oss se på utviklingen av begrepene. En historisk undersøkelse vil tydeliggjøre hvordan begrepene brukes i dag.
- Ordet 'Data Science' har eksistert på 1960-tallet, men den gang ble det brukt som et alternativ til 'Computer Science'. For tiden har det en helt annen betydning.
- I 2008 ble DJ Patil og Jeff Hammerbacher de første personene som kalte seg "Data Scientists" for å beskrive deres rolle på henholdsvis LinkedIn og Facebook.
- I 2012 siterte Harvard Business Review-artikkelen Data Scientist som den 'mest sexy jobb i det 21. århundre'.
- Begrepet Data Mining har utviklet seg parallelt. Det ble utbredt blant databasesamfunnene på 1990-tallet.
- Data Mining skylder sitt opphav til KDD (Knowledge Discovery in Databases). KDD er en prosess for å finne kunnskap fra informasjon som finnes i databaser. Og Data Mining er en viktig delprosess i KDD.
- Data Mining brukes ofte om hverandre sammen med KDD.
Selv om disse navnene har kommet inn i bildet uavhengig, kommer de ofte ut som komplementære til hverandre, når alt kommer til alt er de nært knyttet til dataanalyse.
Sammenligning fra topp mot hode mellom Data Science Vs Data Mining (Infographics)
Nedenfor er Topp 9-sammenligningen av Data Science Vs Data Mining
Eksempel Bruk sak
Tenk på et scenario der du er en stor forhandler i India. Du har 50 butikker som opererer i 10 større byer i India, og du har vært i drift i 10 år.
La oss si at du vil studere de siste 8 års data for å finne antall salg av søtsaker i løpet av høytider i 3 byer. Hvis det er målet ditt, vil jeg anbefale deg å ansette en person med Data Mining-ekspertise. En Data Miner ville sannsynligvis gå gjennom historisk informasjon som er lagret i gamle systemer og benytte algoritmer for å trekke ut trender.
Vurder en annen sak der du vil vite hvilke søtsaker som har fått mer positive anmeldelser. I dette tilfellet er datakildene dine ikke begrenset til databaser, de kan utvides til sosiale nettsteder eller tilbakemeldinger fra kunder. I dette tilfellet vil mitt forslag til deg være å ansette en datavitenskapsmann. En person ansatt som Data Scientist er mer egnet til å anvende algoritmer og utføre denne samfunnsberegnende analysen.
Viktige forskjeller mellom Data Science og Data Mining
Nedenfor er forskjellen mellom data science og data mining er som følger
- Data Mining er en aktivitet som er en del av en bredere kunnskapsoppdagelse i databaser (KDD) -prosess mens Data Science er et studieretning akkurat som anvendt matematikk eller informatikk.
- Ofte blir Data Science sett på i bred forstand, mens Data Mining anses som en nisje.
- Noen aktiviteter under Data Mining som statistisk analyse, skriving av datastrømmer og mønstergjenkjenning kan krysses med Data Science. Dermed blir Data Mining en undergruppe av Data Science.
- Machine Learning i Data Mining brukes mer i mønstergjenkjenning mens den i Data Science har en mer generell bruk.
Merk
- Data Science and Data Mining skal ikke forveksles med Big Data Analytics, og man kan ha både gruvearbeidere og forskere som jobber med store datasett.
Data Science Vs Data Mining Comparision Table
Grunnlag for sammenligning | Datautvinning | Datavitenskap |
Hva er det? | En teknikk | Et område |
Fokus | Forretningsprosess | Vitenskapelig studie |
Mål | Gjør data mer brukbare | Bygge datasentriske produkter for en organisasjon |
Produksjon | Patterns | variert |
Hensikt | Finne trender som tidligere ikke er kjent | Sosial analyse, bygge prediktive modeller, avdekke ukjente fakta og mer |
Yrkesperspektiv | Noen med kunnskap om å navigere på tvers av data og statistisk forståelse kan utføre data mining | En person trenger å forstå maskinlæring, programmering, infografiske teknikker og ha domenekunnskap for å bli dataforsker |
Utstrekning | Data mining kan være en undergruppe av Data Science ettersom gruvedrift er en del av Data Science-rørledningen | Flerfaglig - datavitenskap består av datavisualiseringer, datamiljø, samfunnsvitenskap, statistikk, datamining, naturlig språkbehandling, osv. |
Handler med (typen data) | Stort sett strukturert | Alle former for data - strukturert, semistrukturert og ustrukturert |
Andre mindre populære navn | Datarkeologi, informasjonshøsting, informasjonsoppdagelse, kunnskap utvinning | Datadrevet vitenskap |
Konklusjon - Data Science Vs Data Mining
Så her går du! Jeg er sikker på at nå er du mer bevisst hva nøkkelforskjellene mellom de to er og i hvilken sammenheng de to skal brukes. En ting du bør huske er at det ikke er noen formelle og presise definisjoner av Data Science and Data Mining. Det pågår fortsatt debatter blant akademia og bransje om hva som utgjør en nøyaktig definisjon. Imidlertid er alle på samme side med hensyn til høynivåforskjeller og beskrivelser av de to begrepene som vi utforsket i denne artikkelen.
Anbefalt artikkel
Dette har vært en guide til Data Science Vs Data Mining, deres betydning, sammenligning av topp mot hode, viktige forskjeller, sammenligningstabell og konklusjon. Du kan også se på følgende artikler for å lære mer -
- Datavitenskap og dens voksende betydning
- 7 viktige data gruvedriftsteknikker for best resultat
- Predictive Analytics vs Data Science - Lær den 8 nyttige sammenligningen
- 8 viktige gruvedriftsteknikker for data for vellykket virksomhet