Hjem Personlig finansiering Slik bruker du MapReduce for Big Data - dummies

Slik bruker du MapReduce for Big Data - dummies

Innholdsfortegnelse:

Video: Elite Dangerous Finding Stellar Phenomena 2025

Video: Elite Dangerous Finding Stellar Phenomena 2025
Anonim

MapReduce er en programvare ramme som er ideell for store data fordi det gjør det mulig for utviklere å skrive programmer som kan behandle massive mengder ustrukturert data parallelt over en distribuert gruppe prosessorer.

Kortfunksjonen for store data

Funksjonen map har vært en del av mange funksjonelle programmeringsspråk i mange år. Kartet er gjenopplivet som en kjerneteknologi for behandling av lister over dataelementer.

Operatører på funksjonelle språk endrer ikke strukturen til dataene; de lager nye datastrukturer som deres produksjon. De opprinnelige dataene er uendret også. Så du kan bruke kartfunksjonen med straffrihet fordi det ikke vil skade dine dyrebare lagrede data.

En annen fordel for funksjonell programmering er ikke å måtte eksplisitt styre bevegelsen eller strømmen av dataene. Dette frigjør programmereren fra eksplisitt å administrere datautgang og plassering. Endelig er rekkefølgen av operasjonene på dataene ikke foreskrevet.

En måte å oppnå løsningen på er å identifisere inntastingsdataene og lage en liste:

mylist = ("alle fylker i oss som deltok i det siste generalvalg") > Lag funksjonen howManyPeople ved hjelp av kartfunksjonen

. Dette velger bare fylkene med mer enn 50 000 personer: kart howManyPeople (mylist) = [howManyPeople "fylke 1"; howManyPeople "fylke 2"; howManyPeople "fylke 3"; howManyPeople "fylke 4"; …]

Lag nå en ny utgangsliste over alle fylkene med populasjoner over 50 000:

(nei, fylke 1; ja, fylke 2; nei, fylke 3; ja, fylke 4;?, Fylke nnn)
Funksjonen utføres uten å gjøre noen endringer i den opprinnelige listen. I tillegg kan du se at hvert element i utgangslisten kartlegger et tilsvarende element i inntastingslisten, med ja eller nei vedlagt. Hvis fylket har møtt kravet til mer enn 50 000 personer, identifiserer kartfunksjonen det med ja. Hvis ikke, er et nei angitt.

Legg til reduseringsfunksjonen for store data

Som kartfunksjonen,

redusere har det vært mange funksjoner i funksjonelle programmeringsspråk i mange år. Reduksjonsfunksjonen tar utgangen av en kartfunksjon og "reduserer" listen på hvilken måte programmereren ønsker. Det første trinnet som reduksjonsfunksjonen krever, er å plassere en verdi i noe som kalles en

akkumulator , som har en innledende verdi. Etter lagring av en startverdi i akkumulatoren behandler reduksjonsfunksjonen hvert element i listen og utfører operasjonen du trenger over listen.

På slutten av listen returnerer funksjonen redusere en verdi basert på hvilken operasjon du ønsket å utføre på utgangslisten.

Anta at du må identifisere fylkene hvor flertallet av stemmerne var for den demokratiske kandidaten. Husk at your howManyPeople-kartfunksjonen så på hvert element i inntastingslisten og opprettet en utføringsliste over fylkene med mer enn 50 000 mennesker (ja) og fylkene med mindre enn 50 000 personer (nei).

Etter at du har aktivert howManyPeople-kartfunksjonen, er du igjen med følgende utføringsliste:

(nei, fylke 1; ja, fylke 2; nei, fylke 3; ja, fylke 4;, fylke nnn)

Dette er nå inngangen for reduseringsfunksjonen. Her ser det ut som:

countylist = (nei, fylke 1; ja, fylke 2; nei, fylke 3; ja, fylke 4;?, Fylke nnn) redusere isDemocrat (countylist)

Redusere funksjonsprosessene hvert element i listen og returnerer en liste over alle fylker med en befolkning på over 50 000, hvor flertallet stemte demokratisk.

Sette det store datakartet og redusere sammen

Noen ganger produserer en utgangsliste bare nok. På samme måte er det noen ganger nok å utføre operasjoner på hvert element i en liste. Ofte vil du se gjennom store mengder inngangsdata, velge visse elementer fra dataene, og deretter beregne noe av verdi fra de relevante dataene.

Du vil ikke endre denne inntastingslisten, slik at du kan bruke den på forskjellige måter med nye forutsetninger og nye data.

Programvareutviklere designer applikasjoner basert på algoritmer. En

algoritme er ikke noe mer enn en rekke trinn som må skje i tjeneste til et overordnet mål. Det kan se litt ut som dette: Start med et stort antall eller data eller poster.

  1. Iterate over dataene.

  2. Bruk kartfunksjonen til å trekke ut noe av interesse og opprette en utgangsliste.

  3. Organiser outputlisten for å optimalisere for videre behandling.

  4. Bruk reduseringsfunksjonen til å beregne et sett med resultater.

  5. Lag den endelige utgangen.

  6. Programmører kan implementere alle typer applikasjoner ved hjelp av denne tilnærmingen, men eksemplene til dette punktet har vært veldig enkle, så den virkelige verdien av MapReduce er kanskje ikke tydelig. Hva skjer når du har ekstremt store inngangsdata? Kan du bruke samme algoritme på data terabytes? Den gode nyheten er ja.

Alle operasjonene virker uavhengige. Det er fordi de er. MapReduces virkelige kraft er evnen til å dele og erobre. Ta et veldig stort problem og bryte det inn i mindre, mer håndterbare biter, operer på hver bit uavhengig av hverandre, og trekk alt sammen på slutten. Videre er kartfunksjonen kommutativ - med andre ord, ordren som en funksjon utføres, spiller ingen rolle.

Så MapReduce kan utføre sitt arbeid på forskjellige maskiner i et nettverk. Det kan også trekke fra flere datakilder, internt eller eksternt. MapReduce holder oversikt over sitt arbeid ved å skape en unik nøkkel for å sikre at all behandling er relatert til å løse det samme problemet.Denne nøkkelen brukes også til å trekke alle utgangene sammen på slutten av alle distribuerte oppgaver.

Slik bruker du MapReduce for Big Data - dummies

Redaktørens valg

Hvordan du samler ressurser i Minecraft - dummies

Hvordan du samler ressurser i Minecraft - dummies

Du kan samle ressurser på flere måter for Minecraft-strukturen - noen er mer effektiv enn andre. Her finner du noen forskjellige måter å samle materialer på for din struktur. Du har et par forskjellige alternativer når det gjelder gruvedrift. Hver har sine fordeler og ulemper, så det er opp til ...

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Hvordan bygge Minecraft-kretser og -maskiner med Minecart-spor - dummier

Minecart og skinner er Minecraft-funksjoner ofte brukt til å transportere spillere. Men de kan også utføre mange mekaniske egenskaper bedre enn de vanlige redstone-elementene. Minecarts er enheter som kan rulle raskt langs minecartskinner. De kan svinge, gå opp og ned skråninger, og til og med spore (selv om de lider mye ...

Hvordan bygge din første Minecraft Garden - dummies

Hvordan bygge din første Minecraft Garden - dummies

Se hvordan du oppretter en vakker hage i Minecraft ved å planlegge riktig layout, få en rekke unike planter, og organisere plass.

Redaktørens valg

Markedet ditt mobilnettsted til media - dummies

Markedet ditt mobilnettsted til media - dummies

IPhone og iPad er varme emner i media i disse dager. Når du er ferdig med å designe nettstedet ditt for disse nye medieenhetene, ikke glem å markedsføre dem til tradisjonelle medier. Tiltrekke medieoppmerksomhet til mobilwebområdet ditt er ikke i motsetning til å tiltrekke det til noen annen virksomhet. Trikset er å fortelle et godt ...

Gjør skannede dokumenter søkbare og redigerbare - dummies

Gjør skannede dokumenter søkbare og redigerbare - dummies

Når du skanner et dokument direkte til en PDF-fil, Acrobat fanger all tekst og grafikk på hver side som om de alle var bare ett stort grafisk bilde. Dette er bra så langt det går, bortsett fra at det ikke går veldig langt fordi du ikke kan redigere eller søke i PDF-dokumentet ...

Markedet med SMS-meldinger - dummies

Markedet med SMS-meldinger - dummies

Lengden på SMS- begrenset til 160 tegn, så reklamemeldingen din må være kort og søt. Disse meldingene kan inneholde lenker til nettsteder eller klikk for å ringe meldinger: Du klikker på SMS, slik at telefonen ringer. SMS-kampanjer er mye enklere å håndtere enn ...

Redaktørens valg

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Rediger, endre farge eller fjern Photoshop Shape Layers - dummies

Bruk formlag i Photoshop Creative Suite 5 når målet med designet ditt er å integrere vektormodeller og pikseldata sømløst. Når du har opprettet et formlag, kan du redigere formen, endre fargen eller fjerne laget helt. Rediger en form Som Adobe Illustrator, gir Photoshop både et valg av sti ...

Oppdag Photoshops malerverktøy - dummies

Oppdag Photoshops malerverktøy - dummies

Ingenting i Photoshop CC gir deg mer presis kontroll over fargen i bildet ditt enn ved bruk av blyantpenningen verktøy med en 1-piks pensel. Husk at bildet ditt består av mange småfargede firkanter (piksler), og at fargen på de enkelte firkantene er det som gir utseendet til et tre eller et ...

Forbedre portretter i Photoshop CC - dummier

Forbedre portretter i Photoshop CC - dummier

Forbedre detaljer som å avklare motivets briller i Photoshop CC kan hjelpe bildene dine og portretter ser det mye bedre ut. Whitening tennene er et annet godt triks for å lyse opp bildene dine. Deklarende briller i Photoshop Eyeglasses kan være fotografens mareritt! Refleksjonene fra glass er vanligvis spekulative høydepunkter - det vil si områder av ren ...