Hjem Personlig finansiering Hold oversikt over datablokker med NameNode i HDFS - dummies

Hold oversikt over datablokker med NameNode i HDFS - dummies

Innholdsfortegnelse:

Video: Hold styr på pengene med Jyske Banks app Weekly! 2024

Video: Hold styr på pengene med Jyske Banks app Weekly! 2024
Anonim

NameNode fungerer som adressebok for Hadoop Distributed File System (HDFS) fordi det ikke vet bare hvilke blokker utgjør individuelle filer, men også hvor hver av disse blokkene og deres replikaer er lagret. Når en bruker lagrer en fil i HDFS, er filen delt inn i datablokker, og tre kopier av disse datablokker lagres i slave noder gjennom Hadoop-klyngen.

Det er mange datablokker for å holde oversikt over. Som du kanskje forventer, vet hvor legemene er begravet, gjør NameNode en kritisk viktig komponent i en Hadoop-klynge. Hvis NameNode ikke er tilgjengelig, kan applikasjoner ikke få tilgang til data lagret i HDFS.

Hvis du ser på følgende figur, kan du se NameNode-demonen som kjører på en hovednode-server. All kartinformasjon som omhandler datablokker og deres tilhørende filer, lagres i en fil som heter.

HDFS er et journaling-filsystem, noe som betyr at eventuelle dataendringer logges inn i en redigeringsjournal som sporer hendelser siden det siste kontrollpunktet - sist gang redigeringsloggen ble slått sammen. I HDFS er redigeringsjournalen opprettholdt i en fil som heter den som er lagret på NameNode.

NameNode oppstart og drift

For å forstå hvordan NameNode fungerer, er det nyttig å se på hvordan det starter. Fordi formålet med NameNode er å informere om hvor mange datablokker de trenger å behandle, og for å holde oversikt over den nøyaktige plasseringen der de er lagret, trenger den alle blokkeringssteder og blokk-til-filmappings som er tilgjengelige i RAM.

Dette er trinnene NameNode tar. Hvis du vil laste all informasjonen som NameNode trenger etter at den starter, skjer følgende:

  1. NavnNoden laster filen inn i minnet.

  2. NameNode laster filen og replayer de journaliserte endringene for å oppdatere blokkmetadataene som allerede er i minnet.

  3. DataNode-daemonene sender NameNode-blokkrapporter.

    For hver slave node er det en blokkrapport som viser alle datablokkene som er lagret der, og beskriver helsen til hver enkelt.

Etter at oppstartsprosessen er fullført, har NameNode et komplett bilde av alle dataene som er lagret i HDFS, og den er klar til å motta søknadsforespørsler fra Hadoop-klienter.

Da datafiler legges til og fjernes basert på klientforespørsler, skrives endringene til slaveknutens diskvolumer, journaloppdateringer blir gjort til filen, og endringene gjenspeiles i blokkstedene og metadata lagret i NameNode-minnet.

Gjennom hele klusterlivet sender DataNode-daemonene NameNode-hjerteslagene (et raskt signal) hvert tredje sekund, og indikerer at de er aktive.(Denne standardverdien kan konfigureres.) Hver 6. time (igjen, en konfigurerbar standard) sender DataNodes NameNode en blokkrapport som beskriver hvilke filblokker som er på deres noder. På denne måten har NameNode alltid en oversikt over tilgjengelige ressurser i klyngen.

Skrive data

For å lage nye filer i HDFS, må følgende prosess utføres:

  1. Klienten sender en forespørsel til NameNode for å opprette en ny fil.

    NameNode bestemmer hvor mange blokker som trengs, og klienten får en leieavtale for å lage disse nye filblokkene i klyngen. Som en del av denne leieavtalen har klienten en frist for å fullføre opprettelsesoppgaven. (Denne tidsgrensen sikrer at lagringsplass ikke tas opp av mislykkede klientprogrammer.)

  2. Klienten skriver deretter de første kopiene av filblokkene til slavenoderne ved hjelp av leien som er tildelt av NameNode.

    NameNode håndterer skriveforespørsler og bestemmer hvor filblokkene og deres replikaer skal skrives, balansere tilgjengelighet og ytelse. Den første kopien av en filblokk er skrevet i ett rack, og den andre og tredje kopien er skrevet på en annen rack enn den første kopien, men i forskjellige slave noder i samme rack. Dette arrangementet minimerer nettverkstrafikken samtidig som det sikres at ingen datablokker er på samme feilpunkt.

  3. Når hver blokk er skrevet til HDFS, skriver en spesiell prosess de gjenværende replikene til de andre slavenoder som er identifisert av NameNode.

  4. Etter at DataNode-daemonene har bekreftet at filblokkreplikatene er opprettet, lukker klientprogrammet filen og underretter NameNode, som deretter lukker den åpne leieavtalen.

Lese data

For å lese filer fra HDFS, må følgende prosess utføres:

  1. Klienten sender en forespørsel til NameNode for en fil.

    NameNode bestemmer hvilke blokker som er involvert og velger, basert på blokkens totale nærhet til klienten, og den mest effektive tilgangsstien.

  2. Klienten åpner deretter blokkene ved hjelp av adressene gitt av NameNode.

Balansering av data i Hadoop-klyngen

Over tid, med kombinasjoner av ujevne datainntaksmønstre (der noen slave noder kan ha flere data skrevet til dem) eller knutepunktfeil, vil data sannsynligvis bli ujevnt fordelt over rekkene og slave noder i Hadoop-klyngen din.

Denne ujevne fordeling kan ha en negativ innvirkning på ytelsen fordi etterspørselen på individuelle slave noder vil bli ubalansert; noder med små data vil ikke bli fullt brukt; og noder med mange blokker vil bli overnyttet. ( Merk: Overbruk og underbruk er basert på diskaktivitet, ikke på CPU eller RAM.)

HDFS inneholder et balanserverktøy for å omfordele blokker fra overbrukte slave noder til underutnyttede blokker på forskjellige slave noder og stativer. Hadoop-administratorer bør regelmessig sjekke HDFS-helse, og hvis data blir ujevnt fordelt, bør de påberope balanserverktøyet.

NameNode masterserverdesign

På grunn av sin misjonskritiske karakter trenger mesterserveren som kjører NameNode-demonen, markant forskjellige maskinvarekrav enn de for en slaveknute. Mest betydelig, komponentene på enterprise-nivå må brukes til å minimere sannsynligheten for en feil. Også, du trenger nok RAM til å laste inn i minnet alle metadata og posisjonsdata om alle datablokkene som er lagret i HDFS.

Hold oversikt over datablokker med NameNode i HDFS - dummies

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...