Introduksjon til HBase Architecture

HBase er et open source, distribuert datalagringssystem for nøkkelverdier og kolonneorientert database med høy skriveutgang og tilfeldig leseytelse med lav latens. Ved å bruke HBase kan vi utføre online sanntidsanalyser. HBase-arkitektur har sterk tilfeldig lesbarhet. I HBase blir data fysisk avskåret i det som er kjent som regioner. Hver region er vert for en enkelt region-server, og en eller flere regioner er ansvarlige for hver region-server. HBase Architecture er sammensatt av master-slave-servere. Klyngen HBase har en hovednode kalt HMaster og flere regionservere kalt HRegion Server (HRegion Server). Det er flere regioner - regioner i hver regionale server.

HDFS Storage Mechanism

I HDFS lagres data i tabellen som vist ovenfor.

Hver rad har en nøkkel.

Kolonne: Det er en samling av data som tilhører en kolonnefamilie, og den er inkludert i raden.

Kolonnefamilie: Hver kolonnefamilie består av en eller flere kolonner.

Hver tabell inneholder en samling kolonnefamilier. Disse kolonnene er ikke en del av skjemaet.

HBase har dynamiske kolonner. Ulike celler kan ha forskjellige kolonner fordi kolonnenavn er kodet inne i cellene

Column Qualifier: Column name er kjent som Column Qualifier.

HBase Architecture Components

Det er hovedelementer i HBase-arkitekturen: HMaster og Region Server. Regionale HBase-lagringsdata.

1. HMaster

HMaster-noden er lett og brukes til å tilordne regionen til serverregionen.

Det er noen hovedansvar for Hmaster som er:

  • Gjennomføre noen administrasjonsoppgaver, inkludert lasting, balansering, oppretting av data, oppdatering, sletting, etc.

Ansvarlig for endringer i skjemaet eller endringer i META-data i henhold til retningslinjen for klientapplikasjonen

  • Mye DDL-arbeid på HBase-bord blir håndtert av HMaster.

Noen av metodene som HMaster Interface eksponerer er hovedsakelig. META dataorienterte metoder.

  • Tabell (opprett, fjern, aktiver, deaktiver, fjern tabell)
  • ColumnFamily (legg til Column, modifiser Column)
  • Region (flytt, tilordne)

Klienten kommuniserer både HMaster og ZooKeeper i to retninger. Den kontakter HRegion-servere direkte for å lese og skrive operasjoner. HMaster tildeler regioner til servere i regionen og sjekker på sin side regionale serveres helsetilstand.

2. Regionserver

Vi kan få en grov idé om regionserveren ved hjelp av et diagram som er gitt nedenfor.

Regionservere jobber med noder som håndterer kundenes forespørsler om å lese, skrive, oppdatere og slette. Region Server er lett, den kjører på alle nodene i klyngen Hadoop. Hovedoppgaven til regionserveren er å lagre dataene i områder og å utføre kundeforespørsler. En annen viktig oppgave for HBase Region Server er å bruke Auto-Sharding-metoden for å utføre belastningsbalansering ved å distribuere HBase-tabellen dynamisk når den blir for stor etter å ha satt inn data.

Flere HRegion-servere kan kontaktes av HMaster og utføre følgende funksjoner:

  • Administrering og Regioner vert
  • Del regioner automatisk
  • Håndtering av forespørsler om lesing og skriving
  • Direkte kundekommunikasjon

3. HDFS

HDFS står for Hadoop Distribution File-systemet. Den lagrer hver fil i flere blokker og repliserer blokker over en Hadoop-klynge for å opprettholde feiltoleranse. HDFS leverer høy feiltoleranse og fungerer med rimelige materialer. Ved å bruke billig varevare for å legge til noder i klyngen og prosessere og lagre vil den gi kunden bedre resultater enn den eksisterende maskinvaren. HDFS kontakter komponentene i HBase og lagrer mye data på en distribuert måte.

4. Zookeeper

Zookeeper er et åpen kildekode-prosjekt. HMaster og HRegionServers registrerer seg hos ZooKeeper.
Den tilbyr forskjellige tjenester som å opprettholde konfigurasjonsinformasjon, navngi, tilby distribuert synkronisering, etc. Distribuert synkronisering er prosessen med å tilby koordineringstjenester mellom noder for å få tilgang til kjørende applikasjoner. Den har flyktige noder som representerer regionservere. Master-servere bruker disse nodene til å søke etter tilgjengelige servere.

Disse nodene brukes også til å spore nettverkspartisjoner og serverfeil. Zookeeper er det samhandlende mediet mellom klientregionens server. Hvis en klient ønsker å kommunisere med regionserveren, er dyrepasser kommunikasjonsmediet mellom dem.

Hvordan søk initialiserer i HBase Architecture

Som du vet, er META-tabellplasseringen lagret av Zookeeper. Hver gang en kunde henvender seg til eller skriver forespørsler om HBase, er fremgangsmåten som følger.

Kunden finner ut fra ZooKeeper hvordan du plasserer dem META-tabellen. Klienten ber deretter om den aktuelle radnøkkelen fra META-tabellen for å få tilgang til regionens serverplassering. Med META-tabellplassering, lagrer kunden denne informasjonen. Kunden skal ikke henvise til dem META-tabellen før og hvis området flyttes eller forskyves. Deretter vil META-serveren bli bedt om igjen, og cachen blir oppdatert. Som alltid kaster ikke bort tid på å finne Region Server-plasseringen på META Server, så det sparer tid og fremskynder søkeprosessen.

Funksjoner

Det er enkelt å integrere fra kilden så vel som destinasjonen med Hadoop.

Den distribuerte lagringen som HDFS støttes.

Den har en tilfeldig tilgangsfunksjon ved å bruke en intern Hash-tabell for å lagre data for raskere søk i HDFS-filer.

Fordeler med HBase Architecture

  • Disse kan lagre store datasett
  • Vi kan dele databasen
  • Gigabyte til petabyte kostnadseffektivt
  • Høy tilgjengelighet gjennom replikering og feil

Ulemper ved HBase Architecture

  • SQL-struktur støtter ikke
  • Støtter ikke transaksjon
  • Bare med nøkkel sortert
  • Problemer med klynghukommelse

Konklusjon

HBase er en av NonSql kolonneorientert distribuert database i apache. Mens han sammenligner med Hadoop eller Hive, klarer HBase seg bedre for å hente færre poster. Så i denne artikkelen diskuterte vi HBase-arkitektur, og det er viktige komponenter.

Anbefalte artikler

Dette har vært en guide til HBase Architecture. Her diskuterte vi konseptet, komponenter, funksjoner, fordeler og ulemper. Du kan også gå gjennom andre foreslåtte artikler for å lære mer -

  1. Hva er Big Data Technology?
  2. HDFS vs HBase Hvilken er bedre
  3. Hva er forsamlingsspråk?
  4. Introduksjon til HTML

Kategori: