Introduksjon om Hive Drop Table

Nøkkelordet "DROP" refererer til sletting. For sletting av data krever vi at data er til stede i bikuben.

I Hadoop har vi to funksjoner:

  1. Datalagring
  2. Databehandling

For datalagring kommer HDFS (Hadoop Distribuert filsystem) inn i bildet. Når vi sier at vi har data i bikubetabellen, betyr det to ting:

  1. Data er i HDFS
  2. Vi har en bikubetabell opprettet over den HDFS-filen, og vi laster inn HDFS-filens data i bikuben.

Så i utgangspunktet, for at bikubelen kan ha dataene, er datafilen en forutsetning. I denne artikkelen skal vi se hvordan du kan slippe tabeller i bikuben, hva som skjer når tabellen slippes og alle ting relatert til slippbordet i bikuben.

Typer slippbord i bikube

I bikuben er det to typer bord:

  1. Interntabell eller administrert tabell
  2. Ekstern tabell eller ikke-administrert tabell

Administrert tabell / intern tabell:

  1. I Hive er user / hive / warehouse standardkatalogen. Interne tabeller lagres som standard i denne katalogen. Vi trenger ikke å oppgi plasseringen manuelt mens vi oppretter tabellen.
  2. “Drop tabell” -kommando sletter dataene permanent.
  3. Hive administrerer all sikkerhet for administrerte tabeller.

Jeg har en tabell som allerede er til stede i katalogen "bruker / hive / lager" kalt "koder".

For å sjekke om den eksisterende tabellen er administrert eller ikke administrert, kan vi bruke kommandoen nedenfor:

Kommandosyntax:

Beskriv formatert tabellnavn;

Produksjon:

La oss se, dataene presentert i tabellen "koder".

Først ved å bruke hive-kommando-

For det andre bruker du Hue (Hadoop User Experience a Web UI)

Slett kommando: Slipp tabell tabellnavn;

Produksjon:

Hvis jeg nå vil velge dataene fra "koder", vil det gi meg en feil fordi tabellen er slettet.

Vil heller ikke kunne se denne tabellen i standardkatalogen som er

“Bruker / hive / lager”

Se her,

Ikke-administrert tabell / ekstern tabell:

  1. Eksterne tabeller, vi må oppgi banen der vi trenger å lagre den tabellen ved hjelp av nøkkelordet 'plassering' i opprette tabellkommando.

For eksempel:

Lage ekstern tabell stg_s2_json.products

(produkt ingen streng, produktnavnstreng, beskrivelsesstreng, aktiv streng, opprettet datostreng, oppdatert datostreng) radformat avgrensede felt avsluttet med ', '

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. Hive sletter bare metadataene. Dataene er permanente.
  2. Disse tabellene kan brukes av alle som har tilgang til HDFS, så de trenger å administrere sikkerhet på mappenivå.

For å forstå slippet av den eksterne tabellen, vil vi bruke tabellen "produkter".

La oss sjekke om tabellen er intern eller ekstern. Igjen, "beskriv formatert tabellnavn" -kommando.

Observer “limit 10” i valgt kommando. Tabellprodukter inneholder dataene nedenfor:

For å sjekke det i Hue, ser det slik ut:

La oss se hva som skjer når vi slipper denne tabellen:

syntaks:

Drop table table_name;

Produksjon:

Hvis du prøver å hente tabellens data, kaster det en feil.

For det første, ved å bruke "select" -kommandoen på terminalen, vil det kaste meg en feil som betyr at metadataene for den eksterne tabellen blir slettet.

Se feil her:

For det andre, når du kontrollerer fargen på datatilstanden, er filen "products.json" fremdeles til stede i HDFS, noe som betyr at dataene er permanente.

Konklusjon

Jeg skal gjøre det enkelt og gi deg viktige punkter for begge typer bord. Du bestemmer hvilken type som passer dine behov.

Internt bord

Ekstern tabell

Også kalt "Managed Table"Også kalt "Unmanaged table"
Ingen grunn til å oppgi plassering. Hive standardkatalog administrerer disse dataeneTrenger å oppgi beliggenhet
Sletter tabellens metadata så vel som (Data er midlertidig)Hive vil forlate dataene urørt (dataene er permanente)
Selve bikuben kontrollerer bordets sikkerhetTrenger å administrere sikkerhet på mappenivå

Anbefalte artikler

Dette er en guide til Hive Drop Table. Her diskuterer vi introduksjonen av Hive Drop Table, Typer Drop Table i Hive langs Syntax. Du kan også gå gjennom andre foreslåtte artikler for å lære mer -

  1. Hva er en bikube?
  2. Hive Arkitektur
  3. Hive-kommandoer
  4. Hva er Oracle-databasen
  5. Hive Bestill av
  6. Installasjon av bikube

Kategori: