Video: Big data i real-time 2025
Mens verdenene med store data og det tradisjonelle datalagret vil krysse, er det lite sannsynlig at de vil fusjonere når som helst snart. Tenk på et datalagring som et system for rekord for business intelligence, mye som en CRM eller et regnskapssystem. Disse systemene er svært strukturert og optimalisert for spesifikke formål. I tillegg pleier disse systemene å være svært sentraliserte.
Diagrammet viser en typisk tilnærming til datastrømmer med lagre og mars:
Organisasjoner vil uunngåelig fortsette å bruke datalager for å styre typen strukturerte og operasjonelle data som karakteriserer systemene for rekord. Disse datalagerene vil fortsatt gi forretningsanalytikere muligheten til å analysere nøkkeldata, trender og så videre. Adventen av store data både utfordrer rollen til datalageret og gir en komplementær tilnærming.
Tenk på forholdet mellom datalageret og store data som fusjonerer til å bli en hybridstruktur. I denne hybridmodellen forblir de høyt strukturert optimaliserte operasjonelle dataene i det tett kontrollerte datalageret, mens dataene som er svært distribuert og gjenstand for endring i sanntid, styres av en Hadoop-basert (eller lignende NoSQL) infrastruktur.
Det er uunngåelig at operasjonelle og strukturerte data må samhandle i verden med store data, der informasjonskildene ikke (nødvendigvis) er blitt renset eller profilert. I økende grad forstår organisasjoner at de har et forretningsbehov for å kunne kombinere tradisjonelle datalager med sine historiske forretningsdata kilder med mindre strukturert og overvåket store datakilder. En hybrid tilnærming som støtter tradisjonelle og store datakilder kan bidra til å oppnå disse forretningsmålene.
