Ab initio intervju spørsmål og svar

Så du har endelig funnet drømmejobben din i Ab initio, men lurer på hvordan du kan knekke Ab initio-intervjuet og hva som kan være de sannsynlige spørsmålene om Ab initio-intervju for 2018. Hvert intervju er forskjellig, og omfanget av en jobb er også annerledes. Med dette i bakhodet har vi designet de vanligste Ab initio intervjuspørsmål og svar for 2018 for å hjelpe deg med å få suksess i intervjuet ditt.

Nedenfor er de øverste spørsmålene om Ab initio-intervju som ofte stilles i et intervju. Disse intervjuspørsmålene er delt inn i to deler er som følger:

Del 1 - Ab initio intervjuspørsmål (grunnleggende)

Denne første delen dekker grunnleggende spørsmål og svar på Ab initio-intervjuer.

1. Hva er komponentene eller funksjonene som er tilgjengelige i ab initio?

Svar:
De viktigste komponentene i ab initio er her nedenfor,

KomponentHensikt
DedupFor å fjerne duplikater
Bli medFor å bli med i flere inputdatasett basert på en felles nøkkelverdi.
SortereDenne komponenten omordner dataene. Den tar sorteringsordren og slipper data til minnet
FilterEventuell betinget relatert fjerning av data.
GjenskapeDette er komponenten er hovedsakelig for parallelliteten ettersom en ekstra kopi av data er nyttig mens andre noder ikke er tilgjengelige.
slå sammenDenne komponenten er å kombinere flere inndata.

2. Hva er typene for parallellbehandling?

Svar:
Dette er de vanlige spørsmålene om Ab initio-intervju som stilles i et intervju. Ulike typer parallell behandling er,

  1. Komponentparallellisme
  2. Dataparallalisme
  3. Parallellitet i rørledningen

Komponentparallellitet: En applikasjon som har flere komponenter som kjører på systemet samtidig. Men dataene er separate. Dette oppnås gjennom parallell prosessering på komponentnivå.

Dataparallalisme: Data deles inn i segmenter og kjører operasjonene samtidig. Denne typen prosesser oppnås ved bruk av dataparallalismen

Pipeline parallelism: En applikasjon med flere komponenter, men kjører på samme datasett. Dette bruker rørledningsparallellisme.

3. Hva er den forskjellige måten å oppnå partisjonene på?

Svar:
Det er flere måter å gjøre partisjonene på.

skilleveggerBeskrivelse
UttrykkDatadeling i henhold til datamanipulasjonsspråket.
NøkkelGruppere dataene etter spesifikke taster
LastbalanseDynamisk belastningsbalansering
ProsentdelSegreger dataene der utgangsstørrelsen er på brøkdelene på 100
OmrådeDel dataene jevnt basert på en nøkkel og et område mellom nodene
Rund robinDistribuere dataene jevn i blokkstørrelse på tvers av outputpartisjonene.

La oss gå til neste Ab initio-intervju Spørsmål.

4. Hva er et multifilsystem?

Svar:
Multifile er et sett kataloger på forskjellige noder i en klynge. De har en identisk katalogstruktur. Multifilsystemet fører til en bedre ytelse da det er parallell behandling der dataene ligger på flere disker.

Den er opprettet med kontrollpartisjonen på den ene noden og datapartisjoner på de andre nodene for å distribuere behandlingen for å forbedre ytelsen.

5. Forskjell mellom Hadoop og Ab initio?

Svar:

HadoopAb initio
Åpen kildeProprietær programvare
Parallell prosessering gjennom kartleggere og reduksjonsmaskinerParallell prosesseringsarkitektur
Alle typer data passer best herBest for tradisjonelle EDW-implementeringer
Feiltoleranse oppnåsFeiltoleranse oppnås ikke
MapReduce kontrolleres på alle komponenter eller funksjonerKomponenter som å delta, gruppere, sortere er enkelt

utføres

Billig som åpen kildekode og kan prøve ut alle saker om forretningsbruk.Dyrt og aktuelt på en sak med høye verdier på grunn av kostnadene
Løst koblede komponenter der tilpassede funksjoner er byggetTett koblet mellom komponentene, da de er sterkt anbefalt basert på forretningsbruk.

Del 2 - Ab initio intervjuspørsmål (avansert)

La oss nå se på de avanserte spørsmål om Ab initio-intervjuer.

6. Hva slags oppsett støtter Ab initio?

Svar:

  • Støtter serielle og parallelle oppsett.
  • Et grafisk oppsett støtter både serielle og parallelle oppsett om gangen.
  • Et flerfilsystem er et 4-veis parallelt system
  • En komponent i et grafikksystem kan kjøre 4-veis parallelt system.

7. Hva er forholdet mellom Enterprise metadata miljø (EME), det grafiske utviklingsmiljøet (GDE) og samarbeidende system?

Svar:
CoOperating System: Det opererer på toppen av operativsystemet, og dette er levert av ab initio og det er basen for alle Ab Initio prosesser. Luftkommandoer er en av funksjonene som kan installeres på forskjellige operativsystemer som UNIX, Linux, IBM osv

Dette er følgende funksjoner som den gir,
- Administrerer og kjører Ab Initio grafer og kontrollerer ETL-prosessene
- Tilby utvidelser
- ETL prosesser overvåking og feilsøking
- Metadatastyring og samhandling med EME

GDE: Det er en designkomponent og brukes til å kjøre ab initio-grafene.

Grafer dannes av komponentene (forhåndsdefinerte eller brukerdefinerte) og strømmer og parametrene. Det gir ETL-prosessen i Ab Initio som er representert med grafer.

Mulighet for å kjøre, feilsøke prosesslogger jobber og spore utførelseslogger

Enterprise Meta-Environment (EME): Det er et miljø for lagring og også metadatastyring (Både forretningsmessige og tekniske metadata). Du får tilgang til metadataene fra det grafiske utviklingsmiljøet og også nettleseren eller den samarbeidende kommandolinjen. Det er ab initio depot for eventuelle plassholdere.

La oss gå til de neste spørsmålene om Ab initio-intervju.

8.Hvordan behandles data, og hva er grunnleggende i denne tilnærmingen?

Svar:
Det er visse aktiviteter som krever innsamling av dataene, og det beste er å behandle avhenger i stor grad av det samme i mange tilfeller. Før behandlingen av dataene må den ligge på en plassholder som en veldefinert lagring. Denne oppgaven er avhengig av noen viktige faktorer

1. Innsamling av data
2. Presentasjon
3. Finale utfall
4.Analysis
5.Sorting

9. Hva er forskjellen mellom partisjonering med nøkkel og runde robin?

Svar :
Dette er de avanserte spørsmålene om Ab initio-intervju som stilles i et intervju. Partisjon etter nøkkel
I dette må vi spesifisere nøkkelen basert på hvilken partisjonen vil skje. Det resulterer i velbalanserte data på grunn av nøkkelbaserte partisjoner. Det er nyttig for nøkkelavhengige
parallellitet.
Partisjon av round robin: I dette, fordeler data jevnt i blokkstørrelsesbiter, blir postene delt opp på en sekvensiell måte over utgangspartisjonen. Det er ikke nøkkelen
basert og resultatene er velbalanserte data, spesielt med en blokkstørrelse på 1. Det er nyttig for
registrere uavhengig parallellisme.

10. Hvordan forbedrer du ytelsen til en graf?

Svar :
Det er mange måter ytelsen til grafen kan forbedres.
1) Reduser bruken av flere komponenter i visse faser.
2) Bruk en raffinert og veldefinert verdi av maksimale kjerneverdier for sortering og sammenføyning av komponenter
3) Minimer bruken av vanlige uttrykksfunksjoner som re_index i overføringsfunksjonene
4) Minimer sortert sammenføyningskomponent, og bytt dem om mulig med sammenføyning / hasjforbindelse i minnet
5) Bruk bare obligatoriske felt i sortering, formatering, sammenføyning av komponenter
6) Bruke fase eller strømningsbuffer i tilfeller av sammenslåing eller sorterte sammenføyninger
7) Bruk hash-sammenføyning hvis de to settene med input er lite, ellers er det bedre å velge den sorterte sammenføyningen for den enorme inngangsstørrelsen
8) For større datasett bedre ikke å bruke kringkasting som partisjonert
9) Reduser antall sorteringskomponenter mens du behandler.
10) Unngå omfordeling av data unødvendig

Anbefalt artikkel

Dette har vært en guide til Liste over Ab initio intervjuspørsmål og svar, slik at kandidaten lett kan slå sammen disse Ab initio intervjuspørsmål. Her i dette innlegget har vi studert om topp Ab initio intervjuspørsmål som ofte blir stilt i intervjuer. Du kan også se på følgende artikler for å lære mer -

  1. Spørsmål om Android-intervju - Topp 10 nyttige spørsmål
  2. Spørsmål om statistikkintervju | Nyttig og mest spurt
  3. Minitab-intervjuspørsmål - Topp 7 nyttige spørsmål å lære
  4. Splunk intervju spørsmål og svar du bør vite