Introduksjon til ETL Testing Interview Questions and Answers

Forretningsinformasjon og data er de viktigste tingene enhver virksomhet i disse dager. Å analysere alle dataene og integrere disse resultatene har fått et enormt potensial i markedet. Det er mange ETL-testverktøy som hjelper til med å ha en prosess organisert og enklere. ETL-testing må ha en veldefinert strategi som gjør hele prosessen enklere. Prosessen inkluderer analyse av kravet, validering og testestimering, testplanlegging og utforming av testmiljøet, testdatautarbeidelse og utførelse og lage en sammendragsrapport. Ekstraksjons-, transformasjons- og lasteprosessen trenger mange analyser, og som et resultat trenger riktig testing. Følgende spørsmål gir deg et innblikk i alle spørsmålene som kan stilles i et intervju.

Nå, hvis du leter etter en jobb som er relatert til ETL-testing, må du forberede deg på intervjuspørsmålene til ETL-testen i 2019. Det er sant at hvert intervju er forskjellig per de forskjellige jobbprofilene. Her har vi forberedt de viktige spørsmålene og svarene til ETL-testing av intervjuet som vil hjelpe deg å få suksess i intervjuet.

I denne artikkelen om ETL Testing Interview Questions, skal vi presentere 10 viktigste og ofte brukte ETL Testing intervjuspørsmål. Disse spørsmålene er delt inn i to deler er som følger:

Del 1 - ETL Testing Interview Questions (Basic)

Denne første delen dekker grunnleggende spørsmål og svar på ETL-testintervju

Q1. Hva er ETL og forklare hvorfor ETL-testing er nødvendig?

Svar:
ETL er en forkortelse for å trekke ut, transformere og laste. Denne prosessen gjøres for dataene som brukes til å analysere og forutsi fremtiden til enhver virksomhet. Å trekke ut betyr å lokalisere dataene og fjerne alle kildene fra kildefilen. Transformering er prosessen med å transportere dataene til en hvilken som helst nødvendig fil og laste denne filen til målsystemet i det formatet som er forespurt eller aktuelt. Behovet for ETL-testing oppstår da vi trenger å følge med på data som blir transformert fra et system til et annet. Vi må også sjekke effektiviteten og hastigheten til hele prosessen. ETL-testing sikrer at alle dataene som implementeres er i henhold til kravene fra klienten og gir den nødvendige utdata.

Q2. Hva er surrogatnøkkelen?

Svar:
En surrogatnøkkel kan sies som en unik identifikator som kan brukes til å modellere en enhet eller et objekt. Det kan være en unik nøkkel hvis betydning er å være en primær identifikator for ethvert objekt eller enhet som ikke er avledet fra noen annen database og ikke kan brukes som en primær nøkkel. Surrogatnøkkelen kan være et unikt sekvensnummer. En surrogatnøkkel er ikke alltid en primærnøkkel, og den avhenger vanligvis av databasen. Den velger om databasen er aktuell eller av tidsmessig art. Når en database er aktuell, lagrer den gjeldende data og må ha et forhold til data i data. Når det gjelder den tidsmessige databasen, kan det være et mange til ett forhold mellom primær- og surrogatnøklene.

La oss gå til de neste spørsmålene om ETL-testintervju.

Q3. Forklar hva som er partisjonering og forklar typene partisjoner?

Svar:
For å forbedre ytelsen er transaksjonene som er til stede underinndelt, og denne prosessen er kjent som partisjonering. Partisjonering hjelper Informatica Server til å opprette forskjellige tilkoblinger til de forskjellige kildene. Typene partisjoner er:
Round Robin Partitioning: All data er jevnt fordelt mellom alle partisjoner. I alle disse partisjonene når antall rader er omtrent det samme, brukes denne partisjoneringen.
Hash-partisjonering: I denne partisjoneringen er alle partisjoneringsnøkler gruppert mellom partisjonene, bruker en hasjfunksjon. Det brukes for å sikre at den behandlede gruppen av rader med samme partisjoneringsnøkkel har de samme partisjonene.

Q4. Hva er måtene å oppdatere en tabell når SSIS brukes?
Svar:
Dette er de vanlige ETL-testintervjuet spørsmålene som stilles i et intervju. Nedenfor finner du de forskjellige tabellene som støttes av ETL Testing. Følgende trinn kan utføres for å oppdatere en tabell ved å bruke SSIS:

  • Bruk SQL-kommando
  • Bruk en iscenesettelsestabell til å lagre scenedata
  • Bruk cache til å lagre data som bruker begrenset plass og krever hyppig oppdatering
  • Bruk skript til å planlegge oppgaver
  • Benytt deg av det fullstendige databasenavnet for å oppdatere MSSQL.

Q5. Hva er et iscenesettelsesområde, og hva er formålet?

Svar:
Datastaging er vanligvis en samling av prosesser som brukes til å klargjøre kildesystemdataene. Disse dataene blir deretter lastet inn i datavarehuset. Datastaging inneholder følgende trinn:

Kildedataekstraksjon og datatransformasjon der data er omstrukturert i henhold til kundens krav. Datatransformasjon inkluderer prosessen med rensing av data og verdiforandringer. Det innebærer også prosessen med surrogatnøkkeloppdrag.

Del 2 - ETL Testing Interview Questions (Advanced)

La oss nå se på de avanserte spørsmålene om ETL-testing av intervju.

Q6. Forklar forskjellen mellom ETL-testing og databasetesting?

Svar:
Forskjellen mellom ETL-testing og databasetesting er som nedenfor:

  • ETL-testing fokuserer vanligvis på business intelligence-rapportering, mens databasetesting innebærer en integrasjon av data.
  • Verktøyene som brukes til ETL-testing er Cognos, QuerySurge og Informatica mens QTP og selen brukes til automatisering av databasetesting.
  • Analysen av data i ETL har potensiell innvirkning på data. Den vanlige databasetestingene har innvirkninger på arkitekturen
  • ETL-testing har deformalisert data mens databasetesting bruker normaliserte data.

Q7. Hva er et faktum? Forklar hvilke typer fakta?

Svar:
Et faktum er en sentral komponent i en flerdimensjonal modell som består av tiltakene som skal analyseres. Fakta henger sammen med forskjellige dimensjoner.

Typene fakta er som nedenfor:
Tilsetningsstoff: Et tiltak kan utføre aritmetiske beregninger ved å bruke alle eller noen dimensjoner.
Halvadditiv: I denne typen kan et tiltak utføre aritmetisk beregning ved å bruke bare noen dimensjoner.
Ikke-additiv: Et tiltak kan ikke delta i aritmetiske funksjoner ved å bruke dimensjon.

La oss gå til de neste spørsmålene om ETL-testintervju.

Q8. Hva er forskjellen mellom surrogatnøkkelen og primærnøkkelen?

Svar:
En surrogatnøkkel sies å ha sekvensielt genererte tall som ikke har noen betydning. Den brukes bare for å identifisere radene som er til stede på en unik måte. Primærnøkkel brukes derimot til å identifisere rader unikt. Det er synlig for brukere, og det kan endres i henhold til krav.

Q9. Definer begrepet sakte skiftende dimensjon.
Svar:
Dette er de mest stilte spørsmålene om ETL-testing av intervjuer i et intervju. Sakte skiftende dimensjoner er de som har en tendens til å endre seg veldig sakte. Dataene som er til stede i disse dimensjonene er trege å endre. Eksempel på denne dimensjonen kan være en by eller en ansatt.
Radene i disse dataene i dimensjonene kan enten erstattes helt uten å ha noen sporrekord, eller en ny rad kan opprettes eller settes inn. Ved å bruke dette kan de langsomme endringene også spores.

Q10. Forklar begrepet rensing av data?

Svar:
Slette et stykke data fra datavarehuset er kjent som data-rensing. Disse dataene som blir slettet er vanligvis data som har rader med nullverdier eller mellomrom som trenger opprydding. I denne prosessen rengjøring av denne typen søppel eller søppel, gjøres verdier.

Anbefalt artikkel

Dette har vært en guide til liste over spørsmål og svar på ETL-testing av intervjuer, slik at kandidaten enkelt kan slå sammen disse spørsmålene om intervju av ETL-testing. Her i dette innlegget har vi studert spørsmål om ETL-testintervju som ofte stilles i intervjuer. Du kan også se på følgende artikler for å lære mer -

  1. 10 Essential Power Bi-intervjuspørsmål
  2. PowerShell-intervjuspørsmål - mest nyttige
  3. Topp 10 spørsmål om MicroStrategy-intervju
  4. JIRA intervjuspørsmål