Hjem Personlig finansiering Ytelse og Big Data - dummies

Ytelse og Big Data - dummies

Video: Modular Data Center Supports Ground Breaking Genome Research Analytics | Schneider Electric 2025

Video: Modular Data Center Supports Ground Breaking Genome Research Analytics | Schneider Electric 2025
Anonim

Bare å ha en raskere datamaskin er ikke nok til å sikre riktig ytelsesnivå for å håndtere store data. Du må kunne distribuere komponenter til din store datatjeneste på tvers av en rekke noder. I distribuert databehandling er en knutepunkt et element som finnes i en klynge av systemer eller i et rack.

En node inneholder vanligvis CPU, minne og en slags disk. En knute kan imidlertid også være en CPU og minne som er avhengig av nærliggende lagring i et stativ.

Innenfor et stort datamiljø er disse nodene vanligvis gruppert sammen for å gi skala. For eksempel kan du starte med en stor dataanalyse og fortsette å legge til flere datakilder. For å imøtekomme veksten legger en organisasjon ganske enkelt flere noder inn i en klynge slik at den kan skalere seg for å imøtekomme voksende krav.

Det er imidlertid ikke nok å bare utvide antall noder i klyngen. Det er heller viktig å kunne sende en del av den store dataanalysen til forskjellige fysiske miljøer. Hvor du sender disse oppgavene og hvordan du håndterer dem, gjør forskjellen mellom suksess og fiasko.

I noen komplekse situasjoner vil du kanskje utføre mange forskjellige algoritmer parallelt, selv innenfor samme klynge, for å oppnå hastigheten på analysen som kreves. Hvorfor vil du utføre forskjellige store datalgoritmer parallelt i samme rack? Jo nærmere sammen fordelingene av funksjoner er, desto raskere kan de utføre.

Selv om det er mulig å distribuere stor dataanalyse på tvers av nettverk for å utnytte tilgjengelig kapasitet, må du gjøre denne typen distribusjon basert på krav til ytelse. I noen situasjoner tar bevegelseshastigheten baksetet. Men i andre situasjoner er det raskt å få resultater raskt. I denne situasjonen vil du forsikre deg om at nettverksfunksjonene er i umiddelbar nærhet til hverandre.

Generelt må det store datamiljøet optimaliseres for typen analyseoppgave. Derfor er skalerbarhet lynchpin for å få store data til å fungere vellykket. Selv om det ville være teoretisk mulig å betjene et stort datamiljø i et enkelt stort miljø, er det ikke praktisk.

For å forstå behovene for skalerbarhet i store data, må man bare se på skyvbarhet og forstå både kravene og tilnærmingen. Som cloud computing krever store data inkludering av raske nettverk og billige klynger av maskinvare som kan kombineres i stativer for å øke ytelsen. Disse klyngene støttes av programvareautomatisering som muliggjør dynamisk skalering og lastbalanse.

Design og implementeringer av MapReduce er gode eksempler på hvordan distribuert databehandling kan gjøre store data operasjonelt synlige og rimelige. I hovedsak er selskapene et av de unike vendepunktene i databehandling der teknologikonceptene kommer sammen til rett tid for å løse de rette problemene. Kombinere distribuert databehandling, forbedrede maskinvaresystemer og praktiske løsninger som MapReduce og Hadoop endrer datastyring på dype måter.

Ytelse og Big Data - dummies

Redaktørens valg

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

GED Science test vil stille spørsmål relatert til beskrivende statistikk. Du kan ofte oppsummere en samling av data (fra et eksperiment, observasjoner eller undersøkelser, for eksempel) ved å bruke beskrivende statistikk, tall som brukes til å oppsummere og analysere dataene og trekke konklusjoner fra det. Beskrivende statistikk for en samling av data inkluderer følgende: Frekvens: ...

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Bruk av bevis for å forutsi utfall er en nødvendig ferdighet for GED Science-testen. De største fordelene med vitenskapelige studier kan ofte tilskrives det faktum at deres konklusjoner gjør det mulig for folk å forutsi utfall. (Du vil sikkert ønske vitenskap kan hjelpe deg med å forutsi utfallet ditt på prøve!) Du er vitne til vitenskap i handling hver dag ...

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

GED Social Studies test vil stille spørsmål som krever at du bestemmer troverdigheten til en forfatter. Det er ikke alltid lett å vurdere om en forfatter er troverdig basert på informasjonen som er gitt i en skriftlig oversikt og referansen, men du kan hente spor ved å nøye undersøke følgende områder: Forfatterens ...

Redaktørens valg

Hva skjer i QuickBooks 2013 Setup? - dummies

Hva skjer i QuickBooks 2013 Setup? - dummies

Etter at du har installert QuickBooks 2013, kjører du en skjermveiviser for å sette opp QuickBooks for firmaets regnskap. Klart, denne skjermveiviseren kalles QuickBooks Setup. Når du kjører QuickBooks Setup, gir du ganske mye informasjon til QuickBooks. Som en praktisk sak krever oppsettet og oppsettet etter oppsettet at du har ...

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Når du jobber med betalbar betaling i QuickBooks 2013, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter i QuickBooks 2013 Vendor Center-vinduet viser en liste over leverandører og detaljerte ...

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Når du jobber med betalbar betaling i QuickBooks 2014, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter Vendor Center-vinduet viser en liste over leverandører og detaljert leverandørinformasjon for ...