Introduksjon til spørsmål og svar på Hbase-intervju

HBase er et populært kolonnorientert NoSQL-databasestyringssystem som kjører på toppen av Hadoop Distribution File System (HDFS). Det er godt egnet for sparsomme datasett, som er vanlig i mange tilfeller av bruk av store data.

Her er de 10 mest stilte spørsmålene og svarene fra HBase-intervjuet i 2019: Så du har endelig funnet drømmejobben din i HBase, men lurer på hvordan du kan knekke Hbase-intervjuet, og hva som kan være de sannsynlige spørsmålene om Hbase-intervju. Hvert intervju er forskjellig, og omfanget av en jobb er også annerledes. Med dette i tankene har vi designet de vanligste spørsmålene og svarene til Hbase-intervju for å hjelpe deg med å få suksess i intervjuet. Disse spørsmålene er delt inn i to deler er som følger:

Del 1 - HBase Interview Questions (Basic)

Denne første delen dekker grunnleggende spørsmål og svar fra HBase-intervju.

1. Når bør du bruke HBase?

Svar:
Hbase er ikke egnet for alle tilfeller av bruk. Et best egnet scenario kan identifiseres med følgende kontroller -
i.Data-volum: Bør ha petabyte med data som skal behandles i et distribuert miljø.
ii.Applikasjon: HBase er ikke egnet for OLTP-systemer (Online Transaction Processing) som krever komplekse flerforsagnstransaksjoner. Det mangler også kompleks SQL-støtte som er nødvendig for relasjonsanalyse. Det foretrekkes når du har en enorm datamengde med en litt annerledes skjema.
iii.Cluster Hardware: HBase kjører på toppen av HDFS. Og HDFS fungerer effektivt med et stort antall noder (minimum 5). Så HBase kan være et godt utvalg bare med god maskinvarestøtte.
iv.Not Traditional RDBMS: Hbase kan ikke støtte noen brukssak som krever tradisjonelle funksjoner som Bli med flere tabeller, komplekse SQls med nestede eller vindusfunksjoner osv.
v.Quick tilfeldig tilgang til data: Hvis du trenger en tilfeldig og sanntids tilgang til dataene dine, er HBase en passende kandidat. Det er også en perfekt passform for lagring av store bord med multistrukturerte data.

2. Hva er forskjellen mellom Cassandra og HBase?

Svar:
Både HBase og Cassandra har distribuert NoSQL-database for Big Data fra Hadoop-økosystemet. Begge bygget for forskjellige brukssaker.
HBase har slags master-slave-arkitektur med flere komponenter som Zookeeper, Namenode, HBase Master (Hmaster), og datakoder osv. Cassandra behandler alle noder som mestere, noe som betyr at alle noder er like og utfører alle funksjoner.
HBase er optimalisert for lesing, skriving skjer bare med hovednoden og har sterk konsistens for lesing etter skriving. Cassandra har utmerket leseresultat på en rad hvis eventuell konsistens er valgt.
Hbase støtter ikke sekundære indekser, Cassandra støtter sekundære indekser på kolonnefamilier der kolonnenavnet er kjent.
Opprinnelig ble Hbase opprettet i Google og de kalte den BigTable. Selv nå er APIer for Bigtable og HBase kompatible. Opprinnelsen til Cassandra er fra et papir for DynamoDB som er NoSQL-database fra AWS.

La oss gå til de neste HBase intervjuspørsmål.

3. Hva er hovedkomponentene i Hbase?

Svar:
HBase a har tre viktige komponenter - HMaster, Region Server og ZooKeeper.
i.HBase Master - HBase Tabeller er delt inn i regioner. Mens oppstart Master bestemmer hvilken region som skal tilordnes til hvilken region-server (Region-serveren vil være en node i en klynge). Den håndterer også tabellmetadatafunksjoner som opprette, eller endre skjemaet. Denne komponenten spiller også en viktig rolle i utvinning av feil
ii. Region Server - Som nevnt ovenfor, er det her faktiske data skriving og lesing skjer. Dette er faktiske klyngeknuter. Dette vil ha regioner med mange tabeller som avgjøres ved å starte og avslutte radtastene. En typisk regionserver kan tjene opptil tusen regioner
iii.ZooKeeper - ZooKeeper er et klyngekoordinasjonsrammeverk som er mye brukt i Hadoop økosystem. Zookeeper sporer alle servere (master- og regionservere) som er til stede i klyngen HMaster-kontakter ZooKeeper og varsler produseres i tilfelle feil.

4. Hva er HBase Bloom-filter?

Svar:
Dette er de vanlige HBase-intervjuspørsmålene som stilles i et intervju. Et HBase Bloom-filter er en effektiv mekanisme for å teste om en butikkfil (Når noe er skrevet til HBase, blir det først skrevet til en butikk i minnet. Når denne memstore når en viss størrelse, blir den spylet til disk til en butikkfil ) inneholder en spesifikk rad eller rad-col-celle. Normalt er den eneste måten å bestemme om en radnøkkel er til stede i en butikkfil, å sjekke inn filens blokkeringsindeks, som har startrekkeøkkel for hver blokk i butikkfilen. Bloom-filtre fungerer som en datastruktur i minnet som hjelper til med å redusere harddisklesing til bare filene som sannsynligvis inneholder den raden - ikke alle lagringsfiler. Så det fungerer som en in-memory indeks for å indikere sannsynligheten for å finne en rad i en bestemt butikkfil.

5. Hva er komprimering? Forklar forskjellige typer det.

Svar:
HBase lagrer alle mottatte operasjoner i minnemarkeringsområdet. Når minnebufferen er full, skylles den til disk. Fordi dette kan lage mange små filer i HDFS, fra tid til annen, kan HBase velge filer som skal komprimeres sammen til en større. En komprimering kalles Minor når HBase bare velger noen av HFiles som skal komprimeres, men ikke alle. I en major-komprimering blir alle filene valgt til å bli komprimert sammen. En større komprimering fungerer som en mindre, bortsett fra at slettemarkørene kan fjernes etter at de er brukt på alle relaterte celler, og alle ekstra versjoner av den samme cellen vil også bli slettet.

Del 2 - HBase Interview Questions (Advanced)

La oss nå se på de avanserte spørsmålene om HBase-intervju.

6.Hvordan HBase versjonsdata?

Svar:
Når et stykke data settes inn / oppdateres / slettes, vil HBase opprette en ny versjon for den kolonnen. Faktisk sletting skjer bare mens komprimering. Hvis en bestemt celle overskredet et antall tillatte versjoner, slettes ekstra versjoner under komprimering

7. Hva er forskjellen mellom å skaffe og skanne?

Svar:
Get vil returnere en eneste enkel rad fra Hbase-tabellen basert på gitt tast. Skannekommando returnerer sett med rader avhengig av gitt søkebetingelse. Vanligvis er raskere enn skanning. Så foretrekker å bruke det hvis mulig.

La oss gå til de neste HBase intervjuspørsmål.

8. Hva skjer når du sletter en rad?

Svar:
Ved sletting slettes ikke kommandodata fysisk fra filsystemet, i stedet blir de usynlige ved å sette en markør. Fysisk sletting skjer under en komprimering
Kolonne, versjon og slettemarkører er tre forskjellige markører som markerer sletting av henholdsvis en kolonne, versjon av kolonne og kolonnefamilie.

9. Forklar forskjellen mellom HBase og Hive.

Svar:
Dette er det avanserte spørsmål om HBase Interview Interview som ble stilt i et intervju. HBase og Hive begge er helt forskjellige Hadoop-baserte teknologier for databehandling. Hive er et relasjonslignende SQL-kompatibelt distribuert lagringsramme mens HBase er en NoSQL nøkkelverdi-butikk. Hive fungerer som et abstraksjonslag på toppen av Hadoop med SQL-støtte. Basetilgangs-mønsteret er veldig begrenset med to primære operasjoner-få og skann. HBase er ideell for sanntids databehandling der Hive er et ideelt valg for batchdatabehandling.

10. Hva er Hlog og HFile?

Svar:
HLog er den loggfilen som skrives videre, også kjent som WAL, og HFile er den virkelige datalagringsfilen. Data skrives først til loggfilen som skrives videre, og skrives også i MemStore.Når MemStore er full, blir innholdet i MemStore spylt til disken i HFiles.

Anbefalt artikkel

Dette har vært en guide til Liste over Hbase-intervjuspørsmål og svar, slik at kandidaten lett kan slå sammen disse Hbase-intervjuspørsmålene. Du kan også se på følgende artikler for å lære mer -

  1. Nyttige spørsmål om gruppeintervju
  2. Viktige grunnleggende intervjutips
  3. Viktige trinn for intervjuoppslag
  4. Intervjuspørsmål for å stille en finansieringskandidat