Introduksjon til spørsmål om Hive-intervju og svar

I ny datatid er Hive en open source petabyte skala ETL og Data warehousing infrastrukturverktøypakke for å lagre strukturerte og ustrukturerte data bygd på HDFS (Distribuerte filsystem)
for analyse, spørring og gruvedrift av enorme volumsdatasett ved å aktivere SQL-lignende språk kalt HiveQL (HQL) og enkel utførelse av spørring ved å planlegge Hadoop MapReduce.

Hive er bygget på toppen av Hadoop for å behandle og analysere Big Data og gjør spørring enkelt.
Hive ble opprinnelig opprettet av Facebook, senere ble den ytterligere forbedret og utviklet som en åpen kildekode av Apache Software Foundation og navngitt den som Apache Hive. Det er mange selskaper nå som bruker Apache Hive til Big Data-løsningene sine.

Hvis du er ute etter en jobb som er relatert til Hive, må du forberede deg på spørsmålene om Hive-intervjuet i 2018. Selv om hvert intervju er forskjellig og omfanget av en jobb også er forskjellig, kan vi hjelpe deg med topp 2018 Hive Interview Questions and Answers, som vil hjelpe deg å ta spranget og få deg suksess i intervjuet.

Nedenfor er den øverste listen over spørsmål om Hive-intervju som det meste stilles i et intervju. Disse spørsmålene er delt inn i to deler er som følger:

Del 1 - Hiveintervjuespørsmål (grunnleggende)

Denne første delen dekker grunnleggende spørsmål om Hive-intervju og svar.

1. Liste opp de forskjellige komponentene i Hive-arkitektur?

Svar:
Det er fem kjernekomponenter i Hive-arkitektur er listet opp nedenfor:
• Brukergrensesnitt (UI): Det fungerer som en kommunikator mellom brukere og drivere når brukeren skriver spørsmålene UI godtar det og kjører det på driveren, det er to typer grensesnitt tilgjengelig, de er kommandolinje og GUI-grensesnitt.
• Driver: Den opprettholder livssyklusen til HiveQL-spørringen. Den mottar spørsmålene fra brukergrensesnittet og oppretter økten for å behandle spørringen.
• Compiler: Den mottar spørringsplanene fra driveren og får den nødvendige informasjonen fra Metastore for å utføre planen.
• Metastore: Den lagrer informasjonen om dataene som en tabell; det kan være en intern eller ekstern tabell. Den sender metadatainformasjonen til kompilatoren for å utføre spørringen.
• Utfør motor: Hive-tjeneste vil utføre resultatet i utførelsesmotor; den utfører spørringen i MapReduce for å behandle dataene. Det er ansvarlig for å kontrollere hvert trinn for alle disse komponentene.

2. Hvilke er de forskjellige typene modus Hive kan betjene?

Svar:
Dette er de vanlige spørsmål om Hive-intervju som stilles i et intervju. Hive kan operere på to moduser basert på størrelsen på data,
Disse modusene er:
• Kartreduseringsmodus
•Lokal modus

3. Hvilke er scenariene der Hive kan brukes og ikke kan brukes?

Svar :
Når du oppretter datavarehusapplikasjoner når dataene dine er statisk når applikasjonen ikke trenger høy responstid, når datavolumet er enormt, når dataene ikke endres raskt og når du bruker spørsmål i stedet for å skripte. Hive støtter bare OLAP-transaksjoner, den er ikke egnet for OLTP-transaksjoner.

La oss gå til de neste spørsmålene om Hive-intervjuet.

4. Hva er filformatene som Hive støtter? Liste over hvilke applikasjoner som støttes av HIVE?

Svar:
Som standard støtter Hive Text File-format, og det støtter også det binære filformatet som sekvensfil, ORC-filer, parkettfiler, Avro-datafiler.
• Sekvensfil: Det er vanligvis en fil i binærformat, som kan komprimeres og deles.
• ORC-fil: Optimalisert rad Columnar-fil er spilt inn kolonnebasert fil og kolonneorientert lagringsfil.
• Parkettfil: Det er en kolonneorientert binær fil, den er svært effektiv for store spørsmål.
• Avro-datafil: Det er det samme som sekvensfilformat som er en delbar, komprimerbar og radorientert fil.
Den maksimale størrelsen på strengdatatypen som er tillatt i Hive, er 2 GB.

Hive er et datalagerrammeverk som passer for de applikasjonene som er skrevet i Java, C ++, PHP, Python eller Ruby.

5. Hva er de forskjellige typene tabeller som er tilgjengelige i Hive?

Svar:
Det er to typer tabeller i Hive-applikasjonen, de er:
• Administrerte tabeller: Dataene og skjemaet har kontroll over Hive.
• Eksterne tabeller: Bare skjemaet har kontroll over Hive.

Del 2 - Hiveintervjuespørsmål (avansert)

La oss nå se på de avanserte spørsmålene om Hive-intervju.

6. Hva er en Metastore in Hive? Liste og forklar forskjellige typer Hive Metastores-konfigurasjon?

Svar:
Metastore in Hive brukes til å lagre informasjon om metadata, det er et sentralt depot i Hive. Det gjør det mulig å lagre metadatainformasjonen i en ekstern database. Som standard lagrer Hive Metadata-informasjon i Derby-databasen, men den kan også lagres i andre databaser som Oracle, MySql etc.
Det er tre typer Metastore-konfigurasjon, de er:
• Innebygd metastore: Det er en standardmodus; den kan lokalt få tilgang til Hive-biblioteket, alle kommandolinjefunksjonene blir utført i innebygd modus. Hive-tjenesten, metastore-tjenesten og databasen kjøres i samme JVM.
• Lokal metastore: Den lagrer data i en ekstern database som MySql eller Oracle. Hive-tjenesten og metastore-tjenesten kjører i samme JVM, den kobles til databasen som kjører i separat JVM.
• Ekstern metastore: Den bruker fjernmodus til å kjøre spørsmål, her kjører metastore-tjenesten og bikubetjenesten i en egen JVM. Du kan ha flere metastore servere for å øke tilgjengeligheten.

7. Hva er en Hive Query-prosessor? Hva er de forskjellige komponentene i Hive Query-prosessoren?

Svar:
Dette er de ofte stilte spørsmål om Hive-intervju i et intervju. Hive Query Processor brukes til å konvertere SQL til MapReduce-jobber. Basert på rekkefølgen på avhengigheter utføres jobbene.
Komponentene i Hive Query Processor er listet nedenfor:
• Semantisk analysator
• UDF og UDAF
• Optimizer
•Operatør
• Parser
• Utførelsesmotor
• Skriv inn sjekking
• Generering av logisk plan
• Fysisk plangenerering

8. Hva er funksjonaliteten til Object-Inspector i Hive?

Svar:
Den er sammensatt av Hive som brukes til å identifisere strukturen til de enkelte kolonnene og den interne strukturen til radobjekter. Du får tilgang til de komplekse objektene som er lagret i flere formater ved hjelp av Object-Inspector i Hive.
Object-Inspector vil identifisere strukturen til et objekt og måter å få tilgang til de interne feltene inne i objektet.

La oss gå til de neste spørsmålene om Hive-intervjuet.

9. Hva er de forskjellige måtene å koble applikasjonene til Hive Server?

Svar:
Det er tre måter å koble applikasjonene til Hive-serveren, de er:
• Thrift Client: Dette brukes til å kjøre alle bikube-kommandoene ved å bruke et annet programmeringsspråk som Java, C ++, PHP, Python eller Ruby.
• ODBC Driver: Dette støtter ODBC-protokollen
• JDBC Driver: Dette støtter JDBC-protokollen

10. Hva er standard lese- og skriveklasser i Hive?

Svar:
Nedenfor er lese- og skrivekursene som er tilgjengelige i Hive:
• TextInputFormat - Denne klassen brukes til å lese data i klartekstformat.
• HiveIgnoreKeyTextOutputFormat - Denne klassen brukes til å skrive data i klartekstformat.
• SequenceFileInputFormat - Denne klassen brukes til å lese data i Hadoop Sequence-filformat.
• SequenceFileOutputFormat - Denne klassen brukes til å skrive data i filformatet Hadoop Sequence.

Anbefalt artikkel

Dette har vært en guide til Liste over spørsmål om Hive-intervju og svar, slik at kandidaten lett kan slå sammen disse spørsmålene om Hive-intervjuet. Du kan også se på følgende artikler for å lære mer -

  1. Topp 5 nyttige DBA-intervjuspørsmål og svar
  2. 12 mest fantastiske GitHub-intervjuspørsmål og svar
  3. 15 viktigste spørsmål om rubinintervju og svar
  4. Topp 10 mest nyttige HBase-intervjuspørsmål