Hjem Personlig finansiering Reduksjonsfasen av Hadops MapReduce Application Flow-dummies

Reduksjonsfasen av Hadops MapReduce Application Flow-dummies

Anonim

Reduksjonsfasen behandler nøkler og deres individuelle liste over verdier, slik at det som normalt returneres til klientprogrammet, er et sett med nøkkel / verdi-par. Her er blow-by-blow så langt: Et stort datasett er delt inn i mindre stykker, kalt inngangssplitt, og individuelle forekomster av mapperoppgaver har behandlet hver enkelt av dem.

I noen tilfeller er denne enkeltfasen av behandling alt nødvendig for å generere ønsket programutgang. Hvis du for eksempel kjører en grunnleggende transformasjonsoperasjon på dataene - konverterer all tekst til store versjoner, for eksempel, eller utvider nøkkelbilder fra videofiler - er den eneste fasen alt du trenger. (Dette er kjent som en map-only jobb, forresten.)

Men i mange andre tilfeller er jobben bare halvt ferdig når mapper oppgavene har skrevet utdataene sine. Den gjenværende oppgaven koker ned alle foreløpige resultater til et enkelt, samlet svar.

I likhet med mapper oppgaven, som behandler hver enkelt rekord en-for-en, reduserer reduksjonen hver nøkkel individuelt. Normalt returnerer reduksjonsverktøyet et enkelt nøkkel / verdi-par for hver nøkkel det behandler. Disse nøkkel / verdi-parene kan imidlertid være så ekspansive eller så små som du trenger dem til å være.

Når reduksjonsoppgaver er ferdig, returnerer hver av dem en resultatfil og lagrer den i HDFS (Hadoop Distributed File System). Som vist her, kopierer HDFS-systemet automatisk disse resultatene.

Hvor ressursforvalteren (eller JobTracker hvis du bruker Hadoop 1) forsøker å tilordne ressurser til mapper-oppgaver for å sikre at innspillingen behandles lokalt, finnes det ingen slik strategi for reduksjonsoppgaver. Det antas at mapper oppgavesett sett må overføres over nettverket for å bli behandlet av reduksjonsoppgaver.

Dette er en rimelig implementering fordi det med hundrevis eller tusenvis av mapperoppgaver ikke ville være noen praktisk måte for reduksjonsoppgaver å ha samme lokalitetsprioritering.

Reduksjonsfasen av Hadops MapReduce Application Flow-dummies

Redaktørens valg

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

GED Science test vil stille spørsmål relatert til beskrivende statistikk. Du kan ofte oppsummere en samling av data (fra et eksperiment, observasjoner eller undersøkelser, for eksempel) ved å bruke beskrivende statistikk, tall som brukes til å oppsummere og analysere dataene og trekke konklusjoner fra det. Beskrivende statistikk for en samling av data inkluderer følgende: Frekvens: ...

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Bruk av bevis for å forutsi utfall er en nødvendig ferdighet for GED Science-testen. De største fordelene med vitenskapelige studier kan ofte tilskrives det faktum at deres konklusjoner gjør det mulig for folk å forutsi utfall. (Du vil sikkert ønske vitenskap kan hjelpe deg med å forutsi utfallet ditt på prøve!) Du er vitne til vitenskap i handling hver dag ...

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

GED Social Studies test vil stille spørsmål som krever at du bestemmer troverdigheten til en forfatter. Det er ikke alltid lett å vurdere om en forfatter er troverdig basert på informasjonen som er gitt i en skriftlig oversikt og referansen, men du kan hente spor ved å nøye undersøke følgende områder: Forfatterens ...

Redaktørens valg

Hva skjer i QuickBooks 2013 Setup? - dummies

Hva skjer i QuickBooks 2013 Setup? - dummies

Etter at du har installert QuickBooks 2013, kjører du en skjermveiviser for å sette opp QuickBooks for firmaets regnskap. Klart, denne skjermveiviseren kalles QuickBooks Setup. Når du kjører QuickBooks Setup, gir du ganske mye informasjon til QuickBooks. Som en praktisk sak krever oppsettet og oppsettet etter oppsettet at du har ...

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Når du jobber med betalbar betaling i QuickBooks 2013, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter i QuickBooks 2013 Vendor Center-vinduet viser en liste over leverandører og detaljerte ...

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Når du jobber med betalbar betaling i QuickBooks 2014, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter Vendor Center-vinduet viser en liste over leverandører og detaljert leverandørinformasjon for ...