Hva er datamodellen?

Tolkning og dokumentasjon av eksisterende programvareutformings- og utviklingsprosedyrer og transaksjoner blir referert til som informasjonsmodellering. Metodene og instrumentene for informasjonsmodellering forenkler de komplekse systemdesignene for å gjøre det enklere for re-engineering å bruke informasjon. Det brukes til å designe et informasjonslager logisk og fysisk. I dette emnet skal vi lære om datavarehusmodellering.

Behov for datavarehusmodellering

  1. Innsamling av forretningskrav
  2. Forbedring av ytelsen til databasen
  3. Tilbyr dokumentasjon på kildesystemet og målsystemet

1. Samling av forretningskrav

Et datavarehus er vanligvis designet for å bestemme enhetene som er nødvendige for datavarehuset og fakta som må registreres med dataarkitektene og forretningsbrukerne. Denne første designen har mye iterasjon før den endelige modellen er bestemt.

Vi må overvinne de fremherskende ulempene i designfasen på dette tidspunktet. Siden et eksisterende system implementerer et datavarehus, innlemmer arkitekter noen ganger en stor andel av det gamle systemet i den nye designen, noe som sparer tid eller avsløring.

Den logiske modellen fanger effektivt bedriftens behov og fungerer som et fundament for den fysiske modellen.

2. Forbedre ytelsen til databasen

Kontroll av effektivitet er en vesentlig egenskap ved et datalager. I et datavarehus er enorm informasjon involvert, så det er veldig viktig å bruke et datamodellprodukt for metadata og datahåndtering brukt av BI-forbrukere.

Den fysiske modellen legger til indeksering for å optimalisere effektiviteten til databasen. Ordningene blir også noen ganger endret. For eksempel, hvis et stjerneskema lover raskere datautvinning, kan det bytte til et snøfnuggskjema

3. Tilbyr dokumentasjon av kildesystemet og målsystemet

Når du utvikler et ETL-system, er de fysiske og logiske modellene for kildesystemet og målsystemene veldig viktig å sjekke.

Denne dokumentasjonen tilbys av informasjonsmodellering som referanse for fremtiden.

Konseptuell datamodell

Det høyeste forholdet mellom de forskjellige enhetene bestemmes av en konseptuell datamodell.

Det er det første skrittet mot å lage en datamaskin som er top-down som representerer forretningsorganisasjonens presise presentasjon.

Designer den totale databasestrukturen og lister opp fagområdene

Omfatter enheter og interaksjoner mellom enheter. Symboliske notasjoner (IDEF1X eller IE) representerer forbindelsen mellom emnefeltene. I en informasjonsmodell viser kardinalitet forholdet til ett eller mange

Modell av forholdsdata

Det brukes modellering av relativ informasjon i transaksjonsorienterte OLTP-ordninger. En relasjonsdatamodell har viktige funksjoner:

  • Bruk av nøkkel
  • Dataredundans
  • Forholdet mellom data

Bruk av nøkkel

Hovednøkkelen i en tabell er nøkkelen. Den brukes som en enkelt identifikasjon. En ikke-null kolonne er en primær nøkkel. For hovednøkkelen brukes den utenlandske nøkkelen. De kobler informasjonen fra en tabell til en annen tabell og kobler seg til.

Dataredundans

Forholdsinformasjonsmodellen bruker informasjonsintegritetslover

Dataredundans er eliminert. Et stykke informasjon samles ikke gjentatte ganger. Dette sikrer konsistensen av dataene og begrenset datalagring

Forholdet mellom data

Alle data lagres i tabeller, og hvert forhold har kolonner og rader.

En topptekst og en kropp skal være på bordet. Overskriften er tabellisten over kolonner, og tabellen består av radene. Tupelen er den eneste verdien som er produsert av et veikryss mellom kolonne og rad.

Flerdimensjonal datamodell

En organisasjon som gjenspeiler de viktige enhetene i et selskap og sammenhengen mellom dem, er et logisk perspektiv av en flerdimensjonal datamodell. Databasene og tabellene er ikke begrenset til en naturlig database. ER-diagrammer er ikke avbildet.

  • Attributter
  • fakta
  • Dimensjon

en. Dimensjon

  1. Et aspekt er en datainnsamling som består av individuelle informasjonskomponenter som ikke overlapper hverandre
  2. Du kan angi, gruppere og filtrere informasjon for slutt- brukere.

b. fakta

  1. En tabell med kolonner som brukes til å svare på firmaproblemer av numeriske årsaker.
  2. Tiltakene er additive, semi-additive og non-additive

c. Attributter

  1. De abstrakte forholdene er utformet for å lette sammendraget av informasjonen i en studie
  2. De kan også beskrives som kolonneoverskrifter som ikke er inkludert i en rapportberegning.

Fordeler med dimensjonsmodellen

  1. Standardisering av dimensjoner gjør det enkelt å rapportere på tvers av forretningsområder.
  2. Dimensjonell også for lagring av data for å gjøre det enklere å hente data fra dataene når dataene er lagret i databasen.
  3. Selskapet er veldig forståelig for dimensjonsmodellen. Denne modellen er basert på selskapets vilkår slik at selskapet forstår betydningen av hver virkelighet, aspekt eller funksjon.
  4. For rask informasjonssøking blir dimensjonale modeller deformalisert og optimalisert. Mange relasjonsdatabaseplattformer anerkjenner denne modellen og optimaliserer resultatplanene for spørring.
  5. Dimensjonelle modeller har plass til endring på en enkel måte. Tabeller med dimensjoner kan omfatte flere kolonner uten å påvirke bruken av disse tabellene fra nåværende firmalternativer.

Datamodellering for beste praksis

Før datamodellen begynner, bør en komplett analyse av kundebehandlingsbehov gjennomføres. Det bør være ekstremt viktig å møte kundene for å diskutere krav og teknikker for informasjonsmodellering og å få fagspesialister til selskapet umiddelbart å bekrefte det.

Bedriften skal forstå datamodellen, enten i grafisk / metadataformat eller som forretningsregler for tekster.

Anbefalte artikler

Dette er en guide til Data Warehouse Modelling. Her diskuterer vi datamodellen, hvorfor er den nødvendig i datavarehus sammen med dens fordeler så vel som typer modeller. Du kan også se på følgende artikkel for å lære mer -

  1. Data Warehouse-verktøy
  2. Typer datavarehus
  3. Verktøy til analyse av data
  4. Data Science Tools
  5. Oracle Data Warehousing

Kategori: