Introduksjon til ETL intervjuspørsmål og svar

ETL står for Extract-Transform-Load. Det er en systemfundament for datavarehus, der dataene blir hentet fra de forskjellige kildene, og deretter blir dataene transformert der dataene blir håndhevet eller behandlet for å gjøre kvaliteten, konsistensen av dataene i et passende presentasjonsformat og deretter til slutt data lastes i Data Warehouse i presentasjonsformat, slik at det kan hjelpe sluttbrukeren å få informasjonen enkelt og kan ta en beslutning.

Nedenfor er toppen ETL-intervjuspørsmål fra 2019 som ofte stilles i et intervju

Hvis du leter etter en jobb som er relatert til ETL, må du forberede deg på spørsmålene om ETL-intervjuet i 2019. Selv om hvert intervju er forskjellig og omfanget av en jobb også er forskjellig, kan vi hjelpe deg med de beste ETL-intervjuspørsmålene og svarene, som vil hjelpe deg å ta spranget og få suksess i intervjuet.

Del 1 - ETL-intervjuspørsmål (grunnleggende)

Denne første delen dekker grunnleggende ETL-intervjuspørsmål og svar

1. Utvide ETL-systemet i datavarehuset? Forklare

Svar:
Extract-Transform-Load (ETL) -system er grunnlaget for datavarehuset. Et riktig utformet ETL-system trekker ut data fra kildesystemene, håndhever datakvalitet og konsistensstandarder, bekrefter data slik at separate kilder kan brukes sammen, og til slutt leverer data i et presentasjonsklart format slik at applikasjonsutviklere kan bygge applikasjoner og sluttbrukere kan ta avgjørelser.

2. Betydningen av ETL-systemet i datavarehuset?

Svar :
Fjerner feil og korrigerer manglende data. Den gir dokumenterte målinger av tillit til data. Fanger flyten av transnasjonale data for sikkerhet. Justerer data fra flere kilder som skal brukes sammen. Strukturerer data som skal brukes av sluttbrukerverktøy.

3. Hva er den daglige prosessen i ETL-systemet?

Svar :
Bygg utviklings- / test / produksjonsserien til ETL-prosesser. Forstå avveiningene til forskjellige datarustrestrukturer i rommet, inkludert flate filer, normaliserte skjemaer, XML-skjemaer og stjerneskjøtende (dimensjonale) skjemaer. Analysere og trekke ut kildedata. Bygg et omfattende datarengjøringssystem. Strukturer data i dimensjonale skjemaer for den mest effektive leveransen til sluttbrukere, forretningsintelligensverktøy, data-mining-verktøy, OLAP-terninger og analytiske applikasjoner. Lever data effektivt både til høysentraliserte og dypt distribuerte datavarehus med samme teknikker. Still inn den generelle ETL-prosessen for optimal ytelse.

La oss gå til de neste ETL-intervjuspørsmål.

4. Dataformater i ETL-systemet?

Svar :
Det er forskjellige dataformater i ETL. Noen av dem er flate filer, XML-datasett, uavhengige DBMS-arbeidstabeller, normaliserte enhets- / relasjonsskjemaer (E / R) og dimensjonale datamodeller.

5. Dataprofilering i ETL-system?

Svar :
Dataprofilering er en systematisk undersøkelse av kvaliteten, omfanget og konteksten til en datakilde for å tillate et ETL-system å bygges. På en ekstrem side krever en veldig ren datakilde som er godt vedlikeholdt før den ankommer datavarehuset minimal transformasjon og menneskelig intervensjon for å laste direkte inn i endelige dimensjonstabeller og faktatabeller.

6. Hva er en ETL-validator?

Svar :
ETL Validator er et datatestingsverktøy som i stor grad forenkler testing av dataintegrasjons-, datavarehus- og datamigreringsprosjekter. Den bruker vår patenterte ELV-arkitektur for å trekke ut, laste og validere data fra datakilder som databaser, flatfiler, XML, Hadoop og BI-systemer.

Del 2 - ETL-intervjuspørsmål (avansert)

La oss nå se på de avanserte spørsmålene om ETL-intervju.

7. Hva er operasjonene i ETL-systemet?

Svar :
Følgende tre operasjoner: Ekstraherer dataene fra det transnasjonale systemet som kan være en Oracle, Microsoft eller en hvilken som helst annen relasjonsdatabase. Transformerer dataene ved å utføre datarensingsoperasjoner. En last er en prosess med å skrive dataene inn i måldatabasen.

8. Nevn noen av ETL-verktøyene som oftest brukes i markedet?

Svar:
Det er forskjellige ETL-verktøy som brukes i markedet, men noen av de fuktig foretrukne ETL-verktøyene
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• SAS Data Management.
• Power Center Informatica.
• Elixir Repertoire for Data ETL.
• Data Migrator (IBI)
• SQL Server Integration Services (SSIS)

9. Hva er ETL-teamets roller og ansvar?

Svar:
Rollene til ETL-teamet på høyeste nivå er å bygge bakrommet til datavarehuset.
• Lever data mest effektivt til sluttbrukerverktøy
• Tilfør verdi til data i rengjørings- og konformtrinnene
• Beskytt og dokumentere avstamningen til data
• Pakk ut data fra originalkildene
• Kvalitetssikre og rengjøre data
• Konfigurere etiketter og tiltak i dataene du skal oppnå
• konsistens på tvers av de opprinnelige kildene
• Levering av data i et fysisk format som kan brukes av spørringsverktøy,
• Rapporter forfattere og oversikt.

La oss gå til de neste ETL-intervjuspørsmål.

10. Hva er rollen som konsekvensanalyse i ETL-systemet?

Svar:
Konsekvensanalyse undersøker metadataene som er knyttet til et objekt (i dette tilfellet en tabell eller kolonne) og bestemmer hva som påvirkes av en endring i dens struktur eller innhold. Endring av data-iscenesettelsesobjekter kan ødelegge prosesser som er avgjørende for riktig lasting av datavarehuset. Å tillate ad-hoc-endringer i datainnsamlingsobjekter er skadelig for suksessen til prosjektet ditt. Når en tabell er opprettet i iscenesettelsesområdet, må du utføre en konsekvensanalyse før det gjøres endringer i den. Mange leverandører av ETL-verktøy gir konsekvensanalysefunksjonalitet, men denne funksjonaliteten blir ofte oversett under ETL-produkt-proof-of-concept fordi det er en funksjon i bakrommet og
Ikke veldig viktig før datavarehuset er i gang og begynner å utvikle seg.

11. Hvordan behandler du flatfil med fast lengde?

Svar:
Et filoppsett med fast lengde skal inneholde filnavnet, der feltet begynner; dens lengde; og datatypen (vanligvis tekst eller nummer). Noen ganger leveres sluttposisjonen. Hvis det ikke er det, må du beregne sluttposisjonen til hvert felt basert på startposisjon og lengde hvis det kreves av ETL-verktøyet. I de fleste ETL-verktøy må du sannsynligvis legge inn filoppsettet til flatfilen manuelt. Etter at oppsettet er lagt inn, husker verktøyet oppsettet og forventer den samme oppsettet hver gang det samhandler med den faktiske flatfilen. Hvis fillayouten endres, eller dataene skifter fra de tildelte posisjonene, må ETL-prosessen være programmert til å mislykkes. Når du behandler flate filer med fast lengde, kan du prøve å validere at posisjonene til dataene i filen er nøyaktige. En rask sjekk for å validere stillingene er å teste hvilket som helst dato (eller klokkeslett) felt for å sikre at det er en gyldig dato. Hvis stillingene forskyves, inneholder datofeltet mest sannsynlig alfa-tegn eller ulogiske tall. Andre felt med veldig spesifikke domener kan testes på samme måte. XML tilbyr mer konkrete valideringsevner. Hvis datavalidering eller konsistens er et problem, kan du prøve å overbevise dataleverandøren om å levere dataene i XML-format.

12.Hvorfor sanntids ETL i datavarehus?

Svar:
Datavarehus trengte å gi et urokkelig sett med data til forretnings beslutningstakere, og gi et pålitelig informasjonsgulv å stå på. For up-to-the-moment rapportering mot en blinkende database, ble forretningsbrukere henvist til produksjonsapplikasjonene som driver virksomheten. Derfor måtte brukere gå til datavarehuset for å få et historisk bilde av hva som skjedde i bransjen fra i går, og måtte se over mange OLTP-systemer for å få et bilde av hva som skjedde i dag. Bedriftsbrukere godtok aldri dette skillet fullt ut. Datavarehus trenger selvfølgelig absolutt konstante kundeinformasjonsstrømmer fra en operasjon, men stadig mer operative systemer er avhengige av datavarehusberikelse av kundeinformasjon også. Derfor er det forutsigbart at organisasjoner har begynt å utforske arkitektoniske alternativer som kan støtte mer generaliserte integrasjonsscenarier som flytter driftsdata mellom applikasjoner og samtidig inn og ut av lageret med stadig økende hastighet.

Anbefalte artikler

Dette har vært en guide til Liste over ETL-intervjuspørsmål og svar, slik at kandidaten enkelt kan slå sammen disse ETL-intervjuspørsmålene. Du kan også se på følgende artikler for å lære mer -

  1. Azure Paas vs Iaas - Funksjoner
  2. 9 Fantastiske MapReduce intervjuspørsmål og svar
  3. Topp 11 mest nyttige RDBMS intervjuspørsmål og svar
  4. 10 mest fantastiske PHP-intervjuspørsmål for erfarne
  5. Kjenn De 5 nyttige DBA-intervjuens spørsmål og svar

Kategori: