Introduksjon til Star Schema

Stjerneskjema er den enkleste tilnærmings- og dimensjonsmodellen der funksjonstabellene, dimensjonene og faktaene er ordnet på en organisert måte og det brukes mest i Business Intelligence og Data Warehousing. Et stjerneskema dannes ved å arrangere hvert faktum med tilhørende dimensjoner som ligner en stjerne. Et faktum er et utfall som er uendelig, for eksempel salgsdetaljer og påloggingsinformasjon. En dimensjon er innsamling av referansedata inkludert fakta, for eksempel dato, detaljer om produktet og kunder. Stjerneskjema er optimalisert for enorme dataspørsmål i datavarehus, online analytisk prosessering av datakubber, og også ad-hoc-spørsmål.

Hvordan lage et stjerneskema?

Her skal brukeren lage Star Schema ved konvertering av enhet-forholdsmodellen. Enhetsforholdsmodeller er for kompliserte til å forklare funksjonelle mengder og attributter, slik at det er forenklet til dimensjonalt stjerneskjema som følger:

  • Finn foretaksprosedyren fra visning av enhet-forhold og forstå modellen som kan deles opp i flere dimensjonale modeller. Et enhet-forhold består av forretningsdata.
  • Finn mange til mange tabeller i entitetsforhold som forklarer firmaprosedyren og konverterer dem til dimensjonale virkelighetstabeller. Denne tabellen inneholder data som består av faktatabellen og en dimensjonaltabell med numeriske verdier og unike nøkkelegenskaper.
  • Ideen bak denne prosessen er å differensiere de utvekslingsbaserte informasjonstabellene eller informasjonen som er slettet. Så det er nødvendig å utforme mange til mange forhold. I ERP-databasen er det for eksempel fakturadetaljer som er utvekslingstabellen. Detaljer som oppdateres og oppdateres er utvekslingsbaserte tabeller. Når du sammenligner begge tabellene, er det avledet at dataene virkelig er statiske.
  • Realitetstabellen er en representasjon av en dimensjonell modell som viser mange til mange nettverk mellom endelige målinger. Dette resulterer i at utenlandske nøkler i reality-tabeller deler mange til mange, noe som er et uttalt forhold. mesteparten av denne tabellen faller under utvekslingsbaserte tabeller
  • Det siste trinnet i utformingen av stjerneskjema er å de-normalisere bosettingstabellene i målingstabeller. Den obligatoriske nøkkelen er å lage en duplikatnøkkel. Denne nøkkelen er avhengig av virkelighetsbordet som hjelper til bedre forståelse. Finn dato og klokkeslett fra design av enhet-forhold og arkiver dimensjonstabellen. Datoer lagres som dato og klokkeslettstempler. En datodimensjonskolonne representerer år, måned eller dato eller tid

Eksempel: Tidsdimensjonaltabellen har TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek som kan være viktige kriterier for dimensjonaltabeller. Tilsvarende har alle tabeller unik id og attributter. Spørrespråk som SQL kan brukes på data mining, data warehouse og data analytics.

Syntax of Cube Definisjon:

Define cube (cube-name)(dimension-list): (measure-list)

Kubene blir distribuert for å adressere varslene på forskjellige nivåer, og responstid for å svare på spørringen er minimum. Det er tilgjengelig som et forhåndsbygget design og kan brukes i nødvendige situasjoner. Å lage Star-skjema er veldig enkelt og effektivt å bruke og er tilpasningsdyktig også. Fullføring av faktatabellen og dimensjonaltabellen er obligatorisk, som igjen dannes som stjerne og kan dannes ved hjelp av SQL-spørringer eller løpekode. Dette designet er laget for bedre forståelse og enkel henting av data.

Kjennetegn på Star Schema

1. Stjerneskjema gir raske aggregeringer og beregninger slik som totale solgte varer og inntekter fra inntekter oppnådd ved slutten av hver måned. Disse detaljene og prosessen kan filtreres i henhold til kravene ved å ramme inn passende spørsmål.

2. Den har kapasitet til å filtrere dataene fra normaliserte data og gi behov for datalagring. Den tilhørende informasjonen til den normaliserte tabellen er stablet i fanen for flere dimensjoner. En unik nøkkel genereres for hver faktatabell for å identifisere hver rad.

3. Fakta Tabell er måling av spesifikke hendelser inkludert endelige tallverdier og består av fremmednøkler relatert til dimensjonale tabeller. Denne tabellen er innrammet med faktaverdier på atomnivå og tillater å lagre flere poster om gangen. Det er tre forskjellige typer faktabord.

4. Faktatabeller for transaksjoner består av data om spesifikke hendelser som feriebegivenheter, salgsarrangementer.

5. Registrering av fakta for gitte perioder som kontoinformasjon i slutten av hvert kvartal.

6. Tabeller med rask aggregering i en viss periode kalles akkumulerende stillbilder.

7. Dimensjonaltabeller gir detaljerte attributtdata, poster som finnes i faktatabellen. Dimensjonstabellen kan ha varierte funksjoner. Dimensjonaltabeller brukes hovedsakelig som Tid og dato Dimensjonstabell, Produkt- og innkjøpsordre Dimensjonaltabell, Ansattes og kontodetaljer Dimensjonaltabell, Geografi og lokasjoner dimensjonaltabell. Disse tabellene er tilordnet med en enkelt datatype for heltall, som er duplikat primærnøkkelen.

8. Brukeren kan designe sitt bord i henhold til krav. For eksempel, hvis han trenger et salgsdimensjonalt bord med produkt- og kundenøkkel, dato og tidstast, vil inntektene fra inntektsgenererte nøkkel. Hvis forretningsmannen rammer inn et produktdimensjonalt bord med nøkkelattributter som farge, dato for kjøpt vare, promoteringsnøkkel og klientnøkkel.

Fordeler

  • Det er dannet med enkel logikk og spørringer som er enkle å hente ut dataene fra transaksjonsprosessen.
  • Den har en felles rapporteringslogikk som impliseres dynamisk.
  • Stjerneskjema kan tilby en økning i ytelsen for rapportering av applikasjoner.
  • Stjerneskjema designet av fôring av terninger som er brukt av Online Transaction Process for å bygge og få kubene til å fungere effektivt.

ulemper

  • Den har høy integritet og en høy de-normalisert tilstand. Hvis brukeren ikke klarer å oppdatere verdiene, vil hele prosessen bli kollapset. Beskyttelsen og sikkerheten er ikke pålitelig opp til grensen. Den er ikke så fleksibel som en analytisk modell og utvider ikke sin effektive støtte til mange forhold.
  • Stjerneskjema er distribuert i databasen for å kontrollere raskere gjenoppretting av data. Søket brukes til å velge behov i stedet for å søke i hele databasen. De filtrerte og valgte dataene kan brukes i forskjellige tilfeller. Derfor er dette stjerneskjemaet en enkel modell som blir adoptert enkelt.

Anbefalt artikkel

Dette er en guide til Hva er Star Schema? Her diskuterer vi introduksjonen til stjerneskjemaet og dens egenskaper sammen med fordeler og ulemper. Du kan også gå gjennom andre foreslåtte artikler for å lære mer -

  1. Oversikt over fakta tabell
  2. Star Schema vs Snowflake Schema | Topp forskjeller
  3. Datavarehusmodellering med typer
  4. AWS-databaser med fordeler
  5. AWS Data Pipeline

Kategori: