Forskjellen mellom kart redusere og garn
Garn står for Yet Another Resource Negotiator, det er den nye rammen for å administrere ressurser (Memory and CPU). Det hjelper oss med å utvikle den distribuerte applikasjonen av noe slag, den gir oss nødvendige demoner og APIer. En annen viktig funksjon i YARN er, den håndterer og planlegger ressursforespørsel fra applikasjonen og hjelper prosessen med å utføre forespørselen. YARN er en generisk plattform for å kjøre en distribuert applikasjon. Map Reduce versjon 2 er den distribuerte applikasjonen som kjøres på toppen av YARN, mens kartreduksjon behandler enheten til Hadoop-komponenten, behandler den data parallelt i det distribuerte miljøet. Så i utgangspunktet kartreduserer arbeidet med enorm datakomponent, den behandler dataene og lagrer i HDFS på en slik måte at henting er enklere enn tradisjonell lagring.
Head to Head sammenligning mellom MapReduce vs Yarn (Infographics)
Nedenfor er Topp 10-sammenligningen mellom MapReduce vs Garn
Nøkkelforskjellen mellom MapReduce vs Garn
- I Hadoop 1 har den to komponenter, den første er HDFS (Hadoop Distribuerte filsystem) og den andre er Map Reduce. Mens det i Hadoop 2 også har tokomponent HDFS og YARN / MRv2 (vi kalte vanligvis YARN som Map redusere versjon 2).
- I Map Reduce, når Map-redusere slutter å fungere, vil automatisk alle hans slaveknute slutte å fungere, dette er det scenariet der utførelse av jobb kan avbryte og det kalles et enkelt feil punkt. YARN overvinner dette problemet på grunn av sin arkitektur, YARN har konseptet aktiv navne node samt standby navn node. Når aktiv node slutter å virke i noen tid, begynner passiv node å fungere som aktiv node og fortsette utførelsen.
- Kart redusere har en enkelt master- og flere slavearkitektur. Hvis master-slave går ned, vil hele slaven slutte å virke. Dette er det eneste feilpunktet i HADOOP1, mens HADOOP2, som er basert på YARN-arkitektur, har konseptet multiple master og slave, Hvis en master går ned, vil en annen master fortsette prosessen og fortsette utførelsen.
- Som vi ser i diagrammet nedenfor, er forskjellen i både økosystemer HADOOP1 og HADOOP2. Komponentmessig YARN Ressursstyring samhandler med Map-redusere og HDFS.
I utgangspunktet er YARN ansvarlig for ressursstyring, og betyr hvilken jobb som vil bli utført av hvilket system som blir bestemt av YARN, mens kartreduksjon er programmeringsramme som er ansvarlig for hvordan du utfører en bestemt jobb, så i utgangspunktet har kartreduksjon to komponentkort og redusator for utførelse av et program.
- I Kart reduserer hvert dataknodekjør individuelt, mens i Garn kjøres hver datanode av en nodeadministrator.
- Kart reduserer bruker Job tracker for å opprette og tilordne en oppgave til task tracker på grunn av data, administrasjonen av ressursen er ikke imponerende, fordi noen av datanodene vil holde inaktive og er til ingen nytte, mens i YARN har en Resource Manager for hver klyngen, og hver datanode kjører en Node Manager. For hver jobb vil en slaveknute fungere som Application Master og overvåke ressurser / oppgaver.
MapReduce vs Yarn Comparison Table
Grunnlag for sammenligning | YARN | Kart reduksjon |
Betydning | Garn står for nok en ressursforhandler. | Map Reduce er selvdefinert. |
Versjon | Introduser i Hadoop 2.0 | Introduser i Hadoop 1.0 |
Ansvar | Nå er YARN ansvarlig for ressursstyringsdelen. | Tidligere Map redusering var ansvarlig for ressursstyring så vel som databehandling |
Utførelsesmodell | Garnekjøringsmodell er mer generisk i forhold til kart redusere | Mindre generisk sammenlignet med YARN. |
Gjennomføring av søknad | YARN kan også utføre applikasjonene som ikke følger Map Reduce-modellen | Map Reduce kan utføre sin egen modellbaserte applikasjon. |
Arkitektur | YARN introduseres i MR2 på toppen av jobben tracker og task tracker. I stedet for jobbs tracker og task tracker Application kommer masteren inn i bildet. | I den tidligere versjonen av MR1, er YARN ikke der I stedet for YARN jobbsøker og task tracker var til stede som hjalp til med utførelsen av applikasjon eller jobber |
fleksibilitet | Garn er mer isolert og skalerbar | Mindre skalerbar sammenlignet med YARN. |
Daemons | YARN har Navneknute, Datanode, sekundær Navneknute, Ressursbehandling og Nodehåndtering. | Map Reduce har Navneknute, Datanode, Sekundær Navneknute, jobbsøker og oppgavespor. |
begrensning | Det er ikke noe begrep om enkelt mislykkingspunkt i YARN fordi den har flere Masters, så hvis en mislyktes, vil en annen mester plukke den opp og fortsette utførelsen. | Enkelt feil punkt, lav ressursutnyttelse (Maks 4200 klynger av YAHOO) og mindre skalerbarhet sammenlignet med YARN |
Størrelse | Som standard er størrelsen på en datanode i YARN 128 MB | Som standard er størrelsen på en datanode i kartreduksjon 64MB. |
Konklusjon - MapReduce vs Yarn
I Hadoop 1 som er basert på Map Reduce har flere problemer som overvinnes i Hadoop 2 med Yarn. Som i Hadoop 1 er jobbsikkerhetsansvarlig ansvarlig for ressursstyring, men YARN har konseptet ressursforvalter så vel som nodesjef som vil ta ressursstyring. Kartreduksjon har et enkelt feil punkt, dvs. Jobb tracker. Hvis jobbsøkere slutter å jobbe, må vi starte hele klyngen på nytt og utføre jobben vår igjen fra Initial. I et reelt scenario ønsker ingen av organisasjonen å ta denne typen risiko, spesielt i en bankforsvarssektor. En slik organisasjon som jobber med strømlinjeformede data, er ikke klar til å ta denne typen risiko. For noen få minutter kommer de til å miste dataene sine og kan ha en viktig virksomhetseffekt. Så YARN har et bedre resultat i forhold til Map-redusere.
Anbefalt artikkel
Dette har vært en guide til MapReduce vs garn, deres betydning, sammenligning av topp mot hode, viktige forskjeller, sammenligningstabell og konklusjon. Du kan også se på følgende artikler for å lære mer -
- De 15 beste tingene å vite om MapReduce vs Spark
- Beste 5 forskjeller mellom Hadoop vs MapReduce
- 10 Nyttig forskjell mellom Hadoop vs Redshift
- Apache Hadoop vs Apache Spark | Topp 10 sammenligninger du må vite!
- Hvordan MapReduce fungerer?