Hjem Personlig finansiering På Hadoop og R Language-dummies

På Hadoop og R Language-dummies

Video: Hadoop Processing Frameworks 2025

Video: Hadoop Processing Frameworks 2025
Anonim

Maskinens læringsdisiplin har en rik og omfattende katalogkatalog. Mahout bringer en rekke statistiske verktøy og algoritmer til bordet, men det tar bare en brøkdel av disse teknikkene og algoritmer, da oppgaven med å konvertere disse modellene til et MapReduce-rammeverk er en utfordrende.

Over tid vil Mahout sikkert fortsette å utvide sin statistiske verktøykasse, men inntil da må alle dataforskere og statistikere der ute være oppmerksomme på alternativ statistisk modelleringsprogramvare - det er her R kommer inn.

R-språket er et kraftig og populært open-source statistisk språk og utviklingsmiljø. Den tilbyr et rikt analysekosystem som kan bistå datavitenskapere med datautforskning, visualisering, statistisk analyse og databehandling, modellering, maskinlæring og simulering. R-språket brukes vanligvis av statistikere, data minearbejdere, dataanalytikere og (i dag) dataforskere.

R-programmører har tilgang til Comprehensive R Archive Network (CRAN) biblioteker som fra og med tidspunktet for denne skrivelsen inneholder over 3000 statistiske analysepakker. Disse tilleggene kan trekkes inn i et hvilket som helst R-prosjekt, og gir rike analytiske verktøy for å kjøre klassifisering, regresjon, clustering, lineær modellering og mer spesialiserte maskinlæringsalgoritmer.

Språket er tilgjengelig for de som er kjent med enkle datastrukturtyper - vektorer, skalarer, datarammer (matriser) og lignende - vanligvis brukt av statistikere og programmerere.

Ut av boksen er en av de store fallgruvene med bruk av R-språket den mangelen på støtte det gir for å kjøre samtidige oppgaver. Statistiske språkverktøy som R utmerker seg ved grundig analyse, men mangler skalerbarhet og innfødt støtte for parallelle beregninger.

Disse systemene er ikke-distribusjonsbare og ble ikke utviklet for å skaleres for den moderne petabyte-verdenen med store data. Forslag til å overvinne disse begrensningene må utvide Rs omfang utenom iminnet lasting og enkeltkomputer-utførelsesmiljøer, samtidig som man opprettholder Rs flair for lett distribuerbare statistiske algoritmer.

På Hadoop og R Language-dummies

Redaktørens valg

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

GED Science test vil stille spørsmål relatert til beskrivende statistikk. Du kan ofte oppsummere en samling av data (fra et eksperiment, observasjoner eller undersøkelser, for eksempel) ved å bruke beskrivende statistikk, tall som brukes til å oppsummere og analysere dataene og trekke konklusjoner fra det. Beskrivende statistikk for en samling av data inkluderer følgende: Frekvens: ...

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Bruk av bevis for å forutsi utfall er en nødvendig ferdighet for GED Science-testen. De største fordelene med vitenskapelige studier kan ofte tilskrives det faktum at deres konklusjoner gjør det mulig for folk å forutsi utfall. (Du vil sikkert ønske vitenskap kan hjelpe deg med å forutsi utfallet ditt på prøve!) Du er vitne til vitenskap i handling hver dag ...

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

GED Social Studies test vil stille spørsmål som krever at du bestemmer troverdigheten til en forfatter. Det er ikke alltid lett å vurdere om en forfatter er troverdig basert på informasjonen som er gitt i en skriftlig oversikt og referansen, men du kan hente spor ved å nøye undersøke følgende områder: Forfatterens ...

Redaktørens valg

Hva skjer i QuickBooks 2013 Setup? - dummies

Hva skjer i QuickBooks 2013 Setup? - dummies

Etter at du har installert QuickBooks 2013, kjører du en skjermveiviser for å sette opp QuickBooks for firmaets regnskap. Klart, denne skjermveiviseren kalles QuickBooks Setup. Når du kjører QuickBooks Setup, gir du ganske mye informasjon til QuickBooks. Som en praktisk sak krever oppsettet og oppsettet etter oppsettet at du har ...

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Når du jobber med betalbar betaling i QuickBooks 2013, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter i QuickBooks 2013 Vendor Center-vinduet viser en liste over leverandører og detaljerte ...

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Når du jobber med betalbar betaling i QuickBooks 2014, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter Vendor Center-vinduet viser en liste over leverandører og detaljert leverandørinformasjon for ...