Video: Sugata Mitra: Build a School in the Cloud 2025
Det finnes mange kombinasjoner av distribusjons- og leveringsmodeller for store data i skyen. For eksempel kan du bruke en offentlig sky IaaS eller en privat sky IaaS. Så, hva betyr dette for store data og hvorfor er skyen en god form for det? Vel, store data krever distribuerte klynger av beregningskraft, som er hvordan skyen er arkitektert.
Faktisk gjør en rekke skyskarakteristikker det til en viktig del av det store dataøkosystemet:
-
Skalerbarhet: Skalbarhet med hensyn til maskinvare refererer til evnen til å gå fra små til store mengder prosessorkraft med samme arkitektur. Med hensyn til programvare refererer det til konsistensen av ytelse per kraftenhet som maskinvareressurser øker. Skyen kan skalere til store datamengder.
Distribuert databehandling, en integrert del av skymodellen, fungerer virkelig på en "splittelse og erobre" plan. Så hvis du har store datamengder, kan de deles på tvers av sky servere. En viktig egenskap ved IaaS er at den kan dynamisk skalere. Dette betyr at hvis du trenger mer ressurser enn forventet, kan du få dem. Dette knytter seg til begrepet elastisitet.
-
Elasticitet: Elasticitet refererer til evnen til å utvide eller krympe databehandlingen av ressursbehov i sanntid, basert på behov. En av fordelene ved skyen er at kundene har potensial til å få tilgang til så mye av en tjeneste som de trenger. Dette kan være nyttig for store dataprosjekter der du kanskje trenger å utvide mengden databehandling ressurser du trenger for å håndtere dataene.
-
Ressursbassering: Cloud arkitekturer gjør det mulig å opprette grupper av delte ressurser som gjør skyen økonomisk levedyktig.
-
Med selvbetjening kan brukeren av en skyferdighet bruke en nettleser eller et portalgrensesnitt for å skaffe de nødvendige ressursene, for eksempel å drive en stor prediktiv modell. Dette er dramatisk annerledes enn hvordan du kan få ressurser fra et datasenter, hvor du må be om ressursene fra IT-operasjoner. Ofte lave kostnader på forsiden:
-
Hvis du bruker en skyleverandør, kan ofte kostnader på forhånd reduseres fordi du ikke kjøper store mengder maskinvare eller leier ut nytt rom for å håndtere dine store data. Ved å utnytte stordriftsfordeler knyttet til skymiljøer, kan skyen se attraktiv ut. Betal når du går:
-
Et typisk faktureringsalternativ for en skyleverandør er Pay as You Go, noe som betyr at du faktureres for ressurser som brukes basert på forekomstprising.Dette kan være nyttig hvis du ikke er sikker på hvilke ressurser du trenger for ditt store dataprosjekt. Feiltoleranse:
-
Cloud-tjenesteytere bør ha feiltoleranse innebygd i arkitekturen, og gir uavbrutt tjenester til tross for feil på ett eller flere av systemets komponenter. Klart selve naturen av skyen gjør det til et ideelt databehandling miljø for store data. Så hvordan kan du bruke store data sammen med skyen? Her er noen eksempler:
IaaS i en offentlig sky:
-
I dette scenariet bruker du en offentlig skyveleverandørs infrastruktur for dine store datatjenester fordi du ikke vil bruke din egen fysiske infrastruktur. IaaS kan gi opprettelsen av virtuelle maskiner med nesten ubegrenset lagring og beregning av strøm. Du kan velge operativsystemet du ønsker, og du har fleksibilitet til å dynamisk skalere miljøet for å dekke dine behov. PaaS i en privat sky:
-
PaaS er en hel infrastruktur pakket slik at den kan brukes til å designe, implementere og distribuere applikasjoner og tjenester i et offentlig eller privat skymiljø. PaaS gjør det mulig for en organisasjon å utnytte viktige middleware-tjenester uten å håndtere kompleksiteten ved å håndtere enkelte maskinvare- og programvareelementer. PaaS-leverandører begynner å inkorporere store datateknologier som Hadoop og MapReduce i sine PaaS-tilbud. For eksempel vil du kanskje bygge en spesialisert applikasjon for å analysere store mengder medisinsk data. Søknaden vil benytte seg av sanntidsdata og ikke-sanntidsdata. Det kommer til å kreve Hadoop og MapReduce for lagring og behandling.
SaaS i en hybridsky:
-
Her vil du kanskje analysere "kundeens stemme" -data fra flere kanaler. Mange bedrifter har innsett at en av de viktigste datakildene er hva kunden tenker og sier om deres firma. Å få tilgang til stemmen til kundedataene kan gi uvurderlig innsikt i atferd og handlinger. I økende grad kunder er "vocalizing" på offentlige nettsteder. Verdien av kundeinngangene kan forbedres sterkt ved å inkorporere disse offentlige dataene i analysen.
