Introduksjon til dimensjonstabell
Et dimensjonstabell er til stede i stjernen eller snøfnuggskjemaet. Dimensjonstabeller hjelper til med å beskrive dimensjoner, dvs. dimensjonsverdier, attributter og nøkler. Den er vanligvis liten i størrelse. Størrelsen kan variere fra flere til tusen rader. Den beskriver objektene som er til stede i faktabordet. Dimensjonstabell refererer til samlingen eller gruppen av informasjon relatert til en målbar hendelse. De danner en kjerne for dimensjonell modellering. Den inneholder en kolonne som kan betraktes som en primær nøkkelkolonne som hjelper deg med å identifisere hver dimensjonsrekke eller post. Det blir satt sammen faktabordene gjennom denne nøkkelen. Når det opprettes en nøkkel kalt surrogatnøkkel som er generert av systemet, brukes til å identifisere radene i dimensjonen på en unik måte.
Hvorfor trenger vi å bruke?
- Det hjelper til med å lagre historikken til informasjonen eller dimensjonsinformasjon.
- Det er lett å forstå enn de normaliserte tabellene.
- Flere kolonner kan legges til i tabellen uten å påvirke de eksisterende applikasjonene som bruker disse.
Typer dimensjonstabell
Følgende er de forskjellige typene dimensjonstabell:
1. SCD (sakte skiftende dimensjoner)
Dimensjonsattributtene som har en tendens til å endre seg sakte med tiden i stedet for å endre seg i et jevnlig tidsintervall, kalles sakte endrede dimensjoner. For for eksempel adresse- og telefonnummer endres, men ikke regelmessig. La oss se et eksempel på en mann som reiser til forskjellige land, så han trenger å endre adresse i henhold til det landet. Dette kan gjøres på tre måter:
Type1: Overskriv den forrige verdien. Denne metoden er enkel å bruke og hjelper til med å spare plass og reduserer dermed kostnadene. Men historien går tapt i dette scenariet.
Tabellen før endringen
ID | NAVN | LAND | NASJONALITET |
1001 | Rachel | India | Indian |
Tabell etter endringen
ID | NAVN | LAND | NASJONALITET |
1001 | Rachel | Kina | Indian |
Type2: Legg til en ny rad med den nye verdien. I denne metoden lagres historikken og kan brukes når det er nødvendig. Men det tar stor plass og øker dermed kostnadene.
Tabellen før endringen
ID | NAVN | LAND | NASJONALITET |
1001 | Rachel | India | Indian |
Tabell etter endringen
ID | NAVN | LAND | NASJONALITET |
1001 | Rachel | India | Indian |
1001 | Rachel | Kina | Indian |
Type3: Legg til en ny kolonne. Det er den beste tilnærmingen ettersom historien lett kan opprettholdes.
Tabellen før Endring
ID | NAVN | LAND | NASJONALITET |
1001 | Rachel | India | Indian |
Tabell etter endring
ID | NAVN | LAND | GAMLE LAND | NASJONALITET |
1001 | Rachel | Kina | India | Indian |
2. Utformet dimensjon
Denne dimensjonen deles mellom flere fagområder eller datamars. Samme kan brukes i forskjellige prosjekter uten at det er gjort noen endringer i det samme. Dette brukes for å opprettholde konsistensen. Konformerte dimensjoner er de som er nøyaktig samme eller et riktig underett av noen annen dimensjon.
3. Uønskedimensjon
En søppeldimensjon er en gruppe attributter med lav kardinalitet. Den inneholder forskjellige eller forskjellige attributter som ikke er relatert til andre attributter. Disse kan brukes til å implementere RCD (raskt skiftende dimensjon) som flagg, vekter etc.
4. Degenerert dimensjon
Det attributter som er lagret i selve faktatabellen og ikke som en egen dimensjonstabell, disse attributtene kalles degenerert dimensjon. For f.eks billettnummer, fakturanummer, transaksjonsnummer etc.
5. Rollespilldimensjon
Det å ha flere forhold til faktabordet kalles rollespilldimensjon. Med andre ord, det er når den samme dimensjonsnøkkelen med alle tilhørende attributter blir koblet til mange utenlandske nøkkelgaver i faktatabellen. Den kan oppfylle flere formål innen den samme eksisterende databasen.
Hvordan fungerer det i datavarehuset?
- Dimensjon refererer til samlingen eller gruppen av informasjon relatert til en målbar hendelse. De danner en kjerne for dimensjonell modellering. Når en dimensjon opprettes, genereres en struktur for et prosjekt. Laget kan brukes på tvers av forskjellige prosjekter, og det gjenspeiler ideen om gjenbrukbarhet. Når det gjøres en endring i noe av det, gjenspeiles effekten bare i den aktuelle tabellen. Når en rapport skal opprettes, kan brukeren ta dataene fra som dimensjonstabeller inneholder all nødvendig informasjon.
- Når du utfører dimensjonsmodellering, blir atomdataene lastet inn i dimensjonale strukturer. Deretter blir dimensjonsmodellene generert eller bygd rundt forretningsprosessene. Når du oppretter, må det huskes å filtrere domeneverdier og lagre etiketter på rapportene i disse tabellene. Det må sikres at surrogatnøkkel (Systemgenerert nøkkel brukt under opprettelsen av dimensjonstabell som hjelper til med å identifisere hver post som er til stede i dimensjonstabellen.) Må brukes mens dimensjonstabellen opprettes. Det må denormaliseres fordi oppgaven deres er å la brukeren lese og analysere dataene like effektivt i stedet for å administrere transaksjoner. Hovedmålet med dimensjonen er å gi filtrering, utføre gruppering og effektiv merking.
Fordeler
Nedenfor er de forskjellige fordelene med dimensjonstabellen:
- Det har en enkel struktur.
- Det er enkelt å analysere og forstå.
- Denormaliserte data.
- Hjelper med å opprettholde historisk informasjon for enhver dimensjon.
- Enkelt å hente data fra den.
- Raskt å lage og implementere.
- Det gir konteksten rundt enhver forretningsprosess.
Konklusjon - dimensjonstabell
Dette er en integrert del av datamodellering. Det brukes i stjerne- eller snøfnuggskjema. Den inneholder dimensjoner, nøkler og verdier for attributtene til faktatabellen. Det er forskjellige typer som brukes i forskjellige scenarier.
Anbefalte artikler
Dette er en guide til dimensjonstabell. Her har vi diskutert Typer, Hvordan fungerer dimensjonstabell i datavarehuset med fordeler. Du kan også gå gjennom andre relaterte artikler for å lære mer-
- Faktabord vs dimensjonstabell
- Hva er fakta tabell?
- Hva er Tableau?
- Datablending i Tableau