Hjem Personlig finansiering Shuffle-fasen av Hadops MapReduce Application Flow-dummies

Shuffle-fasen av Hadops MapReduce Application Flow-dummies

Video: Thorium. 2024

Video: Thorium. 2024
Anonim

Etter kartfasen og før begynnelsen av Reduce-fasen er en handoff-prosess, kjent som shuffle og sort . Her fremstilles data fra mapperoppgaver og flyttes til noder der reduksjonsoppgaver vil bli kjørt. Når mapper oppgaven er fullført, blir resultatene sortert etter nøkkel, partisjonert hvis det er flere reduksjonsverktøy, og deretter skrevet til disk.

Du kan se dette konseptet i følgende figur, som viser MapReduce-databehandlingsflyten og samspillet med de fysiske komponentene i Hadoop-klyngen. (En rask notat: Data i minnet representeres av hvite firkanter, og data lagret på disk er representert av grå firkanter.)

For å øke hastigheten på den generelle MapReduce-prosessen, flyttes dataene øyeblikkelig til reduksjonsoppgaverens noder for å unngå en flom av nettverksaktivitet når den endelige mapperoppgaven fullfører sitt arbeid. Denne overføringen skjer mens mapper-oppgaven kjører, da utgangene for hver plate - husk - lagres i minnet av en ventende reduksjonsoppgave. (Du kan konfigurere om dette skjer - eller ikke skjer - og også antall tråder involvert.)

Husk at selv om en reduksjonsoppgave kan ha størsteparten av mapperoppgaveens utgang, kan oppgavens behandling ikke starte før alle mapperoppgaver er ferdig.

For å unngå scenarier der ytelsen til en MapReduce-jobb hindres av en svingende mapperoppgave som kjører på en dårlig slaver node, bruker MapReduce-rammen et konsept som heter spekulativ utførelse .

Hvis noen mapperoppgaver kjører langsommere enn det som anses rimelig, vil Application Master gjore dupliserte oppgaver (i Hadoop 1, gjør JobTracker dette). Uansett hvilken oppgave først ferdig - duplikatet eller originalen - blir resultatene lagret på disk, og den andre oppgaven blir drept. Hvis du overvåker jobbene dine nøye og lurer på hvorfor det er flere mapperoppgaver som kjører enn du forventer, er dette en sannsynlig grunn.

Utgangen fra mapper oppgavene er ikke skrevet til HDFS, men heller til lokal disk på slave node der mapper oppgaven ble kjørt. Som sådan er det ikke replisert over Hadoop-klyngen.

Bortsett fra å komprimere utgangen, kan du potensielt øke ytelsen ved å kjøre en kombinatoroppgave. Denne enkle taktikken, som vises her, innebærer å utføre en lokal reduksjon av utdataene for individuelle mapper-oppgaver.

I de fleste tilfeller er det ikke nødvendig med ekstra programmering, da du kan fortelle at systemet bruker reduksjonsfunksjonen. Hvis du ikke bruker reduksjonsfunksjonen din, må du sørge for at kombinasjonsfunksjonens utgang er identisk med reduksjonsfunksjonen.

Det er opp til MapReduce-rammeverket om kombinasjonsfunksjonen må kjøres en gang, flere ganger eller aldri, så det er kritisk at kombinatorens kode sikrer at de endelige resultatene ikke påvirkes av flere løp. Kjører kombinatoren kan gi en ytelsesfordel ved å redusere mengden mellomliggende data som ellers måtte overføres over nettverket.

Dette reduserer også mengden behandling som reduksjonsoppgaver skulle trenge. Du kjører en ekstra oppgave her, så det er mulig at en ytelsesgevinst er ubetydelig eller kan til og med resultere i dårligere ytelse. Kilometertrykket kan variere, så test dette nøye.

Etter at alle resultatene av mapper oppgavene er kopiert til reduksjonsoppgaver nodene, blir disse filene slått sammen og sortert.

Shuffle-fasen av Hadops MapReduce Application Flow-dummies

Redaktørens valg

Speil Lockup (MUP) på Nikon D7100-dummies

Speil Lockup (MUP) på Nikon D7100-dummies

En komponent i det optiske systemet til din Nikon D7100 kamera er et speil som beveger seg hver gang du trykker på lukkerknappen. Den lille vibrasjonen som følge av speilets handling kan føre til svak utryddelse av bildet når du bruker en veldig langsom lukkerhastighet, skyter med en lang teleobjektiv, ...

Opptaksmuligheter på Nikon D5300 - dummies

Opptaksmuligheter på Nikon D5300 - dummies

Du kan styre noen få aspekter av din filmoppgave på din Nikon D5300. Du kan manipulere videoen din for å skape en rekke effekter. Følgende liste går gjennom disse alternativene: Eksponeringsmodus: Du kan ta opp filmer i hvilken som helst eksponeringsmodus (Auto, Scenemodus, Effektmodus, P, M, og så videre). Som med fortsatt ...

Hvordan man manipulerer eksponering og kontroll på Nikon D5600-dummies

Hvordan man manipulerer eksponering og kontroll på Nikon D5600-dummies

Følgende retusjonsverktøy på din Nikon D5600 kamerajustering eksponering og farge: D-Lighting, Quick Retouch, Filter Effects og Monochrome. Selv om disse verktøyene ikke får deg til å velge ett kamera over en annen, hvis du allerede har en Nikon D5600, er de tilgjengelige, så du kan også lære å bruke dem! D-Lighting: Active D-Lighting ...

Redaktørens valg

DOs og DON'Ts of Fantasy Basketball Draft Picks - dummies

DOs og DON'Ts of Fantasy Basketball Draft Picks - dummies

Hvis du vurderer bli med i en fantasy basketball liga, må du ta hensyn til følgende DOs og DON'Ts før du vurderer spillerne du vil utarbeide på laget ditt. Kreditt: © iStockphoto. com / IS_ImageSource Fantasy basketball draft pick DOS I de fleste fantasy basketball ligaer bestemmer kommisjonen (personen som setter opp ligaen) bestillingen i ...

Linjene og dimensjonene til en basketballbane - dummies

Linjene og dimensjonene til en basketballbane - dummies

En basketballbane har symmetri; Den ene halvdelen av retten er et speilbilde av den andre. Hele basketballbanen (se figur 1) er 94 fot med 50 fot. På hver halvplass viser malte linjer fritt korsbanen og sirkelen, samt trepunktsbuen, hvis avstand fra kurven varierer basert ...

Kjøp av gratis agenter i fantasy fotball - dummies

Kjøp av gratis agenter i fantasy fotball - dummies

I løpet av fantasy fotball sesongen, spillere som ikke blir utarbeidet bli gratis agenter - spillere tilgjengelig for enhver ligamatch villig til å slippe en eid spiller. Bruk gratis agentbassenget til å erstatte en skadet spiller eller noen som bare ikke lever opp til dine forventninger. Bruk disse tipsene for å finne en gratis agent for å ...

Redaktørens valg

Grunnleggende for din iOS-app - dummies

Grunnleggende for din iOS-app - dummies

Heldigvis mesteparten av det du trenger å gjøre så langt som iOS animasjon er opptatt er allerede bygd inn i rammen. Noen visningsegenskaper kan animeres, noe som betyr at du bare må fortelle visningen hvor du skal begynne og hvor du skal avslutte flyttingen, og noen få andre valgfrie parametere, og du er ferdig. ...

Montering av verktøylinjen for Android App Development - dummies

Montering av verktøylinjen for Android App Development - dummies

Når du vet at du er klar til være en Android-utvikler, ta tak i datamaskinen din og få sprekker på å installere verktøyene og rammene som er nødvendige for å bygge ditt første blockbuster-program. Linux-kjernen Android ble opprettet på toppen av åpen kildekode Linux-kjernen. Android-teamet valgte å bruke denne kjernen fordi den ga bevist ...

Grunnleggende om Cocoa Touch i iOS Apps - dummies

Grunnleggende om Cocoa Touch i iOS Apps - dummies

Cocoa Touch-laget inneholder det meste av objektet -orientert utvikler-vendt rammer for å bygge iOS applikasjoner. Det er ditt eneste utgangspunkt for app-utvikling. Apple-guiderne oppfordrer deg til å undersøke teknologiene i dette laget for å se om de oppfyller dine behov, før du ser på de andre lagene. Med andre ord, Apple har til hensikt å ...