Hjem Personlig finansiering Kartfase av Hadops MapReduce Application Flow-dummies

Kartfase av Hadops MapReduce Application Flow-dummies

Video: FabioJ Kart - Finalizando 2024

Video: FabioJ Kart - Finalizando 2024
Anonim

En MapReduce-applikasjon behandler dataene i inngangssplittelser på record-by-record , og at hver plate forstås av MapReduce til å være en nøkkel / verdi par. Etter at inngangssplittelsene er beregnet, kan mapperoppgavene begynne å behandle dem - det vil si rett etter at ressursadministratorens planleggingsfasilitet tildeler dem deres behandlingsressurser. (I Hadoop 1 tilordner JobTracker mapperoppgaver til bestemte behandlingsspor.)

Mappen oppgaven selv behandler sin inngangssplitt en plate om gangen - i figuren representeres denne enslige platen av nøkkel / verdi-paret. Når det gjelder flydata, når inngangssplittene beregnes (ved bruk av standardfilbehandlingsmetode for tekstfiler) antas det at hver rad i tekstfilen er en enkelt post.

For hver plate representerer teksten i rækken seg selv verdien, og byteforskyvningen for hver rad fra begynnelsen av splitten anses å være nøkkelen.

Du lurer kanskje på hvorfor radnummeret ikke brukes i stedet for byteforskyvningen. Når du vurderer at en veldig stor tekstfil er oppdelt i mange individuelle datablokker, og behandles så mange deler, er radnummeret et risikabelt konsept.

Antall linjer i hver deling varierer, så det ville være umulig å beregne antall rader som ligger foran den som behandles. Men med byteforskyvningen kan du være presis, fordi hver blokk har et fast antall byte.

Når en mapper oppgave behandler hver plate, genererer den et nytt nøkkel / verdi-par: Nøkkelen og verdien her kan være helt forskjellig fra inngangsparet. Utdataene fra mapper oppgaven er hele samlingen av alle disse nøkkel / verdi parene.

Før den endelige utdatafilen for hver mapperoppgave er skrevet, deles utgangen basert på nøkkelen og sorteres. Denne partisjonen betyr at alle verdiene for hver nøkkel er gruppert sammen.

I tilfelle av den ganske grunnleggende prøveapplikasjonen er det bare en enkelt reduksjon, så all utdata fra mapper oppgaven er skrevet til en enkelt fil. Men i tilfeller med flere reduksjonselementer, kan hver mapperoppgave generere flere utdatafiler også.

Fordelingen av disse utdatafilene er basert på partisjoneringsnøkkelen. Hvis det for eksempel bare er tre forskjellige partisjoneringsnøkler for mapperoppgavene, og du har konfigurert tre reduksjonsverktøy for jobben, vil det være tre mapper-utdatafiler. I dette eksempelet, hvis en bestemt mapper oppgave behandler en inngangssplitt og det genererer utgang med to av de tre tastene, vil det bare være to utdatafiler.

Komprimer alltid mapper oppgavene dine utdatafiler. Den største fordelen her er i ytelsesgevinster, fordi å skrive mindre utdatafiler minimerer den uunngåelige kostnaden ved å overføre mapperutgangen til noder der reduksjonsmidlene kjører.

Standardpartisjoneren er mer enn tilstrekkelig i de fleste situasjoner, men noen ganger kan det være lurt å tilpasse hvordan dataene deles før det behandles av reduksjonsmaskinene. For eksempel vil du kanskje at dataene i resultatsettene skal sorteres etter nøkkelen og deres verdier - kjent som en sekundær sortering.

For å gjøre dette kan du overstyre standardpartisjoneren og implementere din egen. Denne prosessen krever litt omhu, men fordi du vil sørge for at antall poster i hver partisjon er ensartet. (Hvis en reduksjonsprosess skal behandle mye mer data enn de andre reduksjonsmidlene, vil du vente på at MapReduce-jobben er ferdig, mens den enkle overarbeidede reduksjonsmaskinen slog gjennom sitt uforholdsmessig store datasett.)

Bruk mellomliggende filer med jevne mellomrom, du kan bedre dra nytte av parallellismen som er tilgjengelig i MapReduce-prosessering.

Kartfase av Hadops MapReduce Application Flow-dummies

Redaktørens valg

Speil Lockup (MUP) på Nikon D7100-dummies

Speil Lockup (MUP) på Nikon D7100-dummies

En komponent i det optiske systemet til din Nikon D7100 kamera er et speil som beveger seg hver gang du trykker på lukkerknappen. Den lille vibrasjonen som følge av speilets handling kan føre til svak utryddelse av bildet når du bruker en veldig langsom lukkerhastighet, skyter med en lang teleobjektiv, ...

Opptaksmuligheter på Nikon D5300 - dummies

Opptaksmuligheter på Nikon D5300 - dummies

Du kan styre noen få aspekter av din filmoppgave på din Nikon D5300. Du kan manipulere videoen din for å skape en rekke effekter. Følgende liste går gjennom disse alternativene: Eksponeringsmodus: Du kan ta opp filmer i hvilken som helst eksponeringsmodus (Auto, Scenemodus, Effektmodus, P, M, og så videre). Som med fortsatt ...

Hvordan man manipulerer eksponering og kontroll på Nikon D5600-dummies

Hvordan man manipulerer eksponering og kontroll på Nikon D5600-dummies

Følgende retusjonsverktøy på din Nikon D5600 kamerajustering eksponering og farge: D-Lighting, Quick Retouch, Filter Effects og Monochrome. Selv om disse verktøyene ikke får deg til å velge ett kamera over en annen, hvis du allerede har en Nikon D5600, er de tilgjengelige, så du kan også lære å bruke dem! D-Lighting: Active D-Lighting ...

Redaktørens valg

DOs og DON'Ts of Fantasy Basketball Draft Picks - dummies

DOs og DON'Ts of Fantasy Basketball Draft Picks - dummies

Hvis du vurderer bli med i en fantasy basketball liga, må du ta hensyn til følgende DOs og DON'Ts før du vurderer spillerne du vil utarbeide på laget ditt. Kreditt: © iStockphoto. com / IS_ImageSource Fantasy basketball draft pick DOS I de fleste fantasy basketball ligaer bestemmer kommisjonen (personen som setter opp ligaen) bestillingen i ...

Linjene og dimensjonene til en basketballbane - dummies

Linjene og dimensjonene til en basketballbane - dummies

En basketballbane har symmetri; Den ene halvdelen av retten er et speilbilde av den andre. Hele basketballbanen (se figur 1) er 94 fot med 50 fot. På hver halvplass viser malte linjer fritt korsbanen og sirkelen, samt trepunktsbuen, hvis avstand fra kurven varierer basert ...

Kjøp av gratis agenter i fantasy fotball - dummies

Kjøp av gratis agenter i fantasy fotball - dummies

I løpet av fantasy fotball sesongen, spillere som ikke blir utarbeidet bli gratis agenter - spillere tilgjengelig for enhver ligamatch villig til å slippe en eid spiller. Bruk gratis agentbassenget til å erstatte en skadet spiller eller noen som bare ikke lever opp til dine forventninger. Bruk disse tipsene for å finne en gratis agent for å ...

Redaktørens valg

Grunnleggende for din iOS-app - dummies

Grunnleggende for din iOS-app - dummies

Heldigvis mesteparten av det du trenger å gjøre så langt som iOS animasjon er opptatt er allerede bygd inn i rammen. Noen visningsegenskaper kan animeres, noe som betyr at du bare må fortelle visningen hvor du skal begynne og hvor du skal avslutte flyttingen, og noen få andre valgfrie parametere, og du er ferdig. ...

Montering av verktøylinjen for Android App Development - dummies

Montering av verktøylinjen for Android App Development - dummies

Når du vet at du er klar til være en Android-utvikler, ta tak i datamaskinen din og få sprekker på å installere verktøyene og rammene som er nødvendige for å bygge ditt første blockbuster-program. Linux-kjernen Android ble opprettet på toppen av åpen kildekode Linux-kjernen. Android-teamet valgte å bruke denne kjernen fordi den ga bevist ...

Grunnleggende om Cocoa Touch i iOS Apps - dummies

Grunnleggende om Cocoa Touch i iOS Apps - dummies

Cocoa Touch-laget inneholder det meste av objektet -orientert utvikler-vendt rammer for å bygge iOS applikasjoner. Det er ditt eneste utgangspunkt for app-utvikling. Apple-guiderne oppfordrer deg til å undersøke teknologiene i dette laget for å se om de oppfyller dine behov, før du ser på de andre lagene. Med andre ord, Apple har til hensikt å ...