Ab initio intervju spørsmål og svar
Så du har endelig funnet drømmejobben din i Ab initio, men lurer på hvordan du kan knekke Ab initio-intervjuet og hva som kan være de sannsynlige spørsmålene om Ab initio-intervju for 2018. Hvert intervju er forskjellig, og omfanget av en jobb er også annerledes. Med dette i bakhodet har vi designet de vanligste Ab initio intervjuspørsmål og svar for 2018 for å hjelpe deg med å få suksess i intervjuet ditt.Nedenfor er de øverste spørsmålene om Ab initio-intervju som ofte stilles i et intervju. Disse intervjuspørsmålene er delt inn i to deler er som følger:
Del 1 - Ab initio intervjuspørsmål (grunnleggende)
Denne første delen dekker grunnleggende spørsmål og svar på Ab initio-intervjuer.
1. Hva er komponentene eller funksjonene som er tilgjengelige i ab initio?
Svar:
De viktigste komponentene i ab initio er her nedenfor,
Komponent | Hensikt |
Dedup | For å fjerne duplikater |
Bli med | For å bli med i flere inputdatasett basert på en felles nøkkelverdi. |
Sortere | Denne komponenten omordner dataene. Den tar sorteringsordren og slipper data til minnet |
Filter | Eventuell betinget relatert fjerning av data. |
Gjenskape | Dette er komponenten er hovedsakelig for parallelliteten ettersom en ekstra kopi av data er nyttig mens andre noder ikke er tilgjengelige. |
slå sammen | Denne komponenten er å kombinere flere inndata. |
2. Hva er typene for parallellbehandling?
Svar:
Dette er de vanlige spørsmålene om Ab initio-intervju som stilles i et intervju. Ulike typer parallell behandling er,
- Komponentparallellisme
- Dataparallalisme
- Parallellitet i rørledningen
Komponentparallellitet: En applikasjon som har flere komponenter som kjører på systemet samtidig. Men dataene er separate. Dette oppnås gjennom parallell prosessering på komponentnivå.
Dataparallalisme: Data deles inn i segmenter og kjører operasjonene samtidig. Denne typen prosesser oppnås ved bruk av dataparallalismen
Pipeline parallelism: En applikasjon med flere komponenter, men kjører på samme datasett. Dette bruker rørledningsparallellisme.
3. Hva er den forskjellige måten å oppnå partisjonene på?
Svar:
Det er flere måter å gjøre partisjonene på.
skillevegger | Beskrivelse |
Uttrykk | Datadeling i henhold til datamanipulasjonsspråket. |
Nøkkel | Gruppere dataene etter spesifikke taster |
Lastbalanse | Dynamisk belastningsbalansering |
Prosentdel | Segreger dataene der utgangsstørrelsen er på brøkdelene på 100 |
Område | Del dataene jevnt basert på en nøkkel og et område mellom nodene |
Rund robin | Distribuere dataene jevn i blokkstørrelse på tvers av outputpartisjonene. |
La oss gå til neste Ab initio-intervju Spørsmål.
4. Hva er et multifilsystem?
Svar:
Multifile er et sett kataloger på forskjellige noder i en klynge. De har en identisk katalogstruktur. Multifilsystemet fører til en bedre ytelse da det er parallell behandling der dataene ligger på flere disker.
Den er opprettet med kontrollpartisjonen på den ene noden og datapartisjoner på de andre nodene for å distribuere behandlingen for å forbedre ytelsen.
5. Forskjell mellom Hadoop og Ab initio?
Svar:
Hadoop | Ab initio |
Åpen kilde | Proprietær programvare |
Parallell prosessering gjennom kartleggere og reduksjonsmaskiner | Parallell prosesseringsarkitektur |
Alle typer data passer best her | Best for tradisjonelle EDW-implementeringer |
Feiltoleranse oppnås | Feiltoleranse oppnås ikke |
MapReduce kontrolleres på alle komponenter eller funksjoner | Komponenter som å delta, gruppere, sortere er enkelt
utføres |
Billig som åpen kildekode og kan prøve ut alle saker om forretningsbruk. | Dyrt og aktuelt på en sak med høye verdier på grunn av kostnadene |
Løst koblede komponenter der tilpassede funksjoner er bygget | Tett koblet mellom komponentene, da de er sterkt anbefalt basert på forretningsbruk. |
Del 2 - Ab initio intervjuspørsmål (avansert)
La oss nå se på de avanserte spørsmål om Ab initio-intervjuer.
6. Hva slags oppsett støtter Ab initio?
Svar:
- Støtter serielle og parallelle oppsett.
- Et grafisk oppsett støtter både serielle og parallelle oppsett om gangen.
- Et flerfilsystem er et 4-veis parallelt system
- En komponent i et grafikksystem kan kjøre 4-veis parallelt system.
7. Hva er forholdet mellom Enterprise metadata miljø (EME), det grafiske utviklingsmiljøet (GDE) og samarbeidende system?
Svar:
CoOperating System: Det opererer på toppen av operativsystemet, og dette er levert av ab initio og det er basen for alle Ab Initio prosesser. Luftkommandoer er en av funksjonene som kan installeres på forskjellige operativsystemer som UNIX, Linux, IBM osv
Dette er følgende funksjoner som den gir,
- Administrerer og kjører Ab Initio grafer og kontrollerer ETL-prosessene
- Tilby utvidelser
- ETL prosesser overvåking og feilsøking
- Metadatastyring og samhandling med EME
GDE: Det er en designkomponent og brukes til å kjøre ab initio-grafene.
Grafer dannes av komponentene (forhåndsdefinerte eller brukerdefinerte) og strømmer og parametrene. Det gir ETL-prosessen i Ab Initio som er representert med grafer.
Mulighet for å kjøre, feilsøke prosesslogger jobber og spore utførelseslogger
Enterprise Meta-Environment (EME): Det er et miljø for lagring og også metadatastyring (Både forretningsmessige og tekniske metadata). Du får tilgang til metadataene fra det grafiske utviklingsmiljøet og også nettleseren eller den samarbeidende kommandolinjen. Det er ab initio depot for eventuelle plassholdere.
La oss gå til de neste spørsmålene om Ab initio-intervju.
8.Hvordan behandles data, og hva er grunnleggende i denne tilnærmingen?
Svar:
Det er visse aktiviteter som krever innsamling av dataene, og det beste er å behandle avhenger i stor grad av det samme i mange tilfeller. Før behandlingen av dataene må den ligge på en plassholder som en veldefinert lagring. Denne oppgaven er avhengig av noen viktige faktorer
1. Innsamling av data
2. Presentasjon
3. Finale utfall
4.Analysis
5.Sorting
9. Hva er forskjellen mellom partisjonering med nøkkel og runde robin?
Svar :
Dette er de avanserte spørsmålene om Ab initio-intervju som stilles i et intervju. Partisjon etter nøkkel
I dette må vi spesifisere nøkkelen basert på hvilken partisjonen vil skje. Det resulterer i velbalanserte data på grunn av nøkkelbaserte partisjoner. Det er nyttig for nøkkelavhengige
parallellitet.
Partisjon av round robin: I dette, fordeler data jevnt i blokkstørrelsesbiter, blir postene delt opp på en sekvensiell måte over utgangspartisjonen. Det er ikke nøkkelen
basert og resultatene er velbalanserte data, spesielt med en blokkstørrelse på 1. Det er nyttig for
registrere uavhengig parallellisme.
10. Hvordan forbedrer du ytelsen til en graf?
Svar :
Det er mange måter ytelsen til grafen kan forbedres.
1) Reduser bruken av flere komponenter i visse faser.
2) Bruk en raffinert og veldefinert verdi av maksimale kjerneverdier for sortering og sammenføyning av komponenter
3) Minimer bruken av vanlige uttrykksfunksjoner som re_index i overføringsfunksjonene
4) Minimer sortert sammenføyningskomponent, og bytt dem om mulig med sammenføyning / hasjforbindelse i minnet
5) Bruk bare obligatoriske felt i sortering, formatering, sammenføyning av komponenter
6) Bruke fase eller strømningsbuffer i tilfeller av sammenslåing eller sorterte sammenføyninger
7) Bruk hash-sammenføyning hvis de to settene med input er lite, ellers er det bedre å velge den sorterte sammenføyningen for den enorme inngangsstørrelsen
8) For større datasett bedre ikke å bruke kringkasting som partisjonert
9) Reduser antall sorteringskomponenter mens du behandler.
10) Unngå omfordeling av data unødvendig
Anbefalt artikkel
Dette har vært en guide til Liste over Ab initio intervjuspørsmål og svar, slik at kandidaten lett kan slå sammen disse Ab initio intervjuspørsmål. Her i dette innlegget har vi studert om topp Ab initio intervjuspørsmål som ofte blir stilt i intervjuer. Du kan også se på følgende artikler for å lære mer -
- Spørsmål om Android-intervju - Topp 10 nyttige spørsmål
- Spørsmål om statistikkintervju | Nyttig og mest spurt
- Minitab-intervjuspørsmål - Topp 7 nyttige spørsmål å lære
- Splunk intervju spørsmål og svar du bør vite