Introduksjon til Data Mart
Verden blir mer digital og hver organisasjon genererer flere petabyte med data. Data Mart er en slik klassifisering av data fra et datavarehus hvor konsentrasjonen er på ett emne.
Vi kan si at det er dataene angående en spesifikk avdeling eller kategori som salg, økonomi eller markedsføring, etc. I utgangspunktet er det en undergruppe av datavarehus. Siden det er konsentrasjon om spesifikke fag eller avdeling, kan vi si at kilden til den er begrenset eller at den er avhengig av svært få kilder.
Data Mart vs Data Warehouse
Et datavarehus er et lager med en samling av data fra flere strømmer av emnet. Vedlikeholds- og kontrolldelen som innsamling av rå data og behandling av dem blir hovedsakelig håndtert av Corporate Information Technology IT-grupper som leverer forskjellige tjenester til overordnede organisasjoner.
Datavarehuset blir også referert til som et sentralt eller foretaksdatavarehus. Så kilden til et datavarehus vil være mangfoldig i motsetning til datamarten som i noen tilfeller er en undergruppe av datavarehus.
Typer av data Mart
Det er typisk tre typer datamars. De er:
1. Dependent Data Warehouse
En avhengig datamart er rent fra datavarehuset, og alle grupperte avhengige vil danne et foretaks datavarehus. Det er rent en undergruppe av datavarehus siden det er opprettet fra sentralt DW.
Siden rene og oppsummerte data allerede er til stede i det sentrale datavarehuset ETT-prosessen, eller Extract Transform and Transportation er forenklet. Vi trenger bare å identifisere den spesielle delmengden her og utføre ETT på toppen av det.
Disse datamartene er vanligvis bygget for å oppnå bedre tilgjengelighet og mye forbedret ytelse med bedre kontroll og effektivitet.
2. Uavhengige data Mart
Dette er ikke opprettet fra det sentrale datavarehuset, og kilden til dette kan være forskjellig. Siden data er fra andre enn den sentrale DW ETT-prosessen er litt annerledes.
De fleste av de uavhengige datamartene brukes av en mindre gruppe organisasjoner, og kilden til dette er også begrenset. Den uavhengige datamarkedet opprettes generelt når vi trenger å få en løsning i relativt kortere tidsavgrensning.
3. Hybrid Data Mart
Med hybrid datamart kan du gruppere dataene fra alle andre kilder enn det sentrale datavarehuset DW. Når vi arbeider med ad hoc-integrasjon, vil dette være en stor fordel for topparbeidet på alle produktene som ble lagt til organisasjonene eksternt.
Funksjoner av Data Mart
Nedenfor er noen av funksjonene i en datamart:
- Siden kilden til dataene er konsentrert for å underlegge seg, forbedres brukerens responstid ved å bruke den.
- For ofte nødvendige data vil bruk av datamars være fordelaktig siden det er underett til sentralt DW og dermed vil datastørrelsen være mindre.
- Siden volumet av dataene er begrenset, vil behandlingstiden bli ganske redusert sammenlignet med sentrale Dws.
- Disse er i utgangspunktet smidige og kan imøtekomme endringene i modellen ganske raskt og effektivt sammenlignet med datavarehuset.
- Datamart krever en enkelt fagekspert for å håndtere, i motsetning til lagerdata, ekspertisen vi trenger i flere faglager. På grunn av dette sier vi at datamart er mer smidig.
- Vi kan skille tilgangskategorier til et lavt nivå med partisjonerte data og med datamart, det er mye enkelt.
- Infrastrukturavhengighet er ganske begrenset, og data kan lagres på forskjellige maskinvareplattformer etter segmentering.
Trinn for å implementere data Mart
Nedenfor er trinnene som kreves for å implementere det.
1. Designe
Dette vil være det første trinnet i implementeringen der alle nødvendige oppgaver og kilder identifiseres for å samle teknisk og forretningsinformasjon. Senere blir den logiske planen implementert og ved gjennomgang vil denne bli konvertert til en fysisk plan. I tillegg blir den logiske og fysiske strukturen av dataene bestemt her, slik som hvordan man partisjonerer dataene og felt for partisjon som dato eller en hvilken som helst annen fil.
2. Konstruksjon
Dette er den andre fasen av implementeringen der fysiske databaser ble generert ved hjelp av RDBMS, som ble bestemt som en del av designprosessen og logiske strukturer. Alle objekter som skjema, indekser, tabeller, visninger osv. Opprettes.
3. Befolkning
Dette er den tredje fasen, og her blir data befolket i den ved innhenting av dataene. Alle nødvendige transformasjoner blir implementert før du fyller inn dataene på den.
4. Tilgang
Dette er neste trinn i implementeringen der vi vil bruke de befolkede dataene til å spørre etter for å lage rapporter. Sluttbruker bruker dette trinnet for å forstå dataene ved hjelp av spørsmål.
5. Administrere
Dette er det siste trinnet i implementeringen av datamarten, og her blir forskjellige oppgaver som tilgangsstyring, systemoptimalisering og innstilling, administrering og lagt til ferske data til datamart og planlegging av utvinningsscenarier for å håndtere eventuelle feiltilfeller ivaretatt.
Fordelene med Data Mart
Følgende er noen av fordelene ved å bruke den.
- Det er et av de beste kostnadseffektive alternativene til et datavarehus der du bare trenger å jobbe med et lite datasegment.
- Segregering av data fra kilder vil gjøre datamart effektivt ettersom en bestemt gruppe mennesker kan jobbe dataene fra en spesifikk kilde i stedet for alle som bruker datavarehuset.
- Raskere tilgang til dataene er mulig ved å bruke datamart hvis vi vet hvilken undergruppe vi trenger for å få tilgang til.
- Datamart er mye enklere å bruke, slik at sluttbrukere enkelt kan spørre på toppen av dem.
- Å komme til implementeringstiden datamart krever mindre tid sammenlignet med datavarehuset siden dataene er adskilt i grupper.
- Historiske data fra et bestemt emne kan brukes for enkel trendanalyse.
Konklusjon
Fordi det er konsentrert om et enkelt funksjonelt område, er det mange fordeler både for prosessimplementøren og sluttbrukeren. Derfor er effektiv marsimplementering nødvendig sammen med et datavarehus i organisasjonen.
Anbefalte artikler
Dette er en guide til Hva er Data Mart. Her diskuterer vi introduksjonen, funksjonene og topp 3-typene sammen med funksjonene og trinnene. Du kan også se på følgende artikler for å lære mer -
- Oracle Data Warehousing
- R Datatyper
- Python datatyper
- Cassandra datamodellering
- Komplett guide til datamodell i Cassandra