Innholdsfortegnelse:
Video: OneLife Ask Dr Ruja Webinar July 13th, 2017 Norw and Eng subtitles Final 2025
Ved bruk av store data endres distribusjonsmodellene for å administrere data. Det tradisjonelle datalagret implementeres typisk på et enkelt, stort system i datasenteret. Kostnadene ved denne modellen har ført organisasjoner til å optimalisere disse varehusene og begrense omfanget og størrelsen på dataene som administreres.
Men når organisasjoner vil utnytte den enorme mengden informasjon som genereres av store datakilder, virker begrensningene i de tradisjonelle modellene ikke lenger. Datamagasinet har derfor blitt en praktisk metode for å skape et optimert miljø for å støtte overgangen til ny informasjonshåndtering.
Den store datautstyrmodellen
Når selskapene trenger å kombinere data warehouse strukturen med store data, kan apparatmodellen være ett svar på problemet med skalering. Typisk er apparatet et integrert system som inneholder maskinvare (vanligvis i et stativ) som er optimalisert for datalagring og -administrasjon.
Fordi de er selvforsynte, kan apparater være relativt enkle og raske å implementere, samt tilby lavere kostnader for drift og vedlikehold. Derfor blir systemet forhåndslastet med en relasjonsdatabase, Hadoop-rammen, MapReduce og mange av verktøyene som hjelper til med å innta og organisere data fra en rekke kilder.
Det inneholder også analytiske motorer og verktøy for å forenkle prosessen med å analysere data fra flere kilder. Apparatet er derfor et engangs system som vanligvis inneholder grensesnitt for å gjøre det lettere å koble til et eksisterende datalager.
Den store dataskyremodellen
Skyen blir en overbevisende plattform for å håndtere store data og kan brukes i et hybridmiljø med lokale miljøer. Noen av de nye innovasjonene i lasting og overføring av data forandrer allerede muligheten til skyen som en stor datalagringsplattform.
For eksempel, Aspera, et selskap som spesialiserer seg på rask dataoverføring mellom nettverk, samarbeider med Amazon. com for å tilby cloud data management services. Andre leverandører som FileCatalyst og Data Expedition er også fokusert på dette markedet. I hovedsak bruker denne teknologikategorien nettverket og optimaliserer det for å flytte filer med redusert ventetid.
Da dette problem med latens i dataoverføring fortsetter å utvikle seg, vil det være normen å lagre store datasystemer i skyen som kan samhandle med et datalager som også er skybasert eller et lager som sitter i datasenteret.
