Video: Beste Praksis 2024
Mange bedrifter utforsker store dataproblemer og kommer opp med noen innovative løsninger. Nå er det på tide å være oppmerksom på noen beste praksis, eller grunnleggende prinsipper, som vil hjelpe deg godt når du begynner din store datafil.
I virkeligheten passer stor dataintegrasjon i den samlede prosessen med integrasjon av data over hele bedriften. Derfor kan du ikke bare kaste bort alt du har lært av dataintegrasjon av tradisjonelle datakilder. De samme reglene gjelder om du tenker på tradisjonell datahåndtering eller stor datahåndtering.
Hold disse hovedproblemene øverst på listen over prioriterte områder for stor dataintegrasjon:
-
Hold datakvaliteten i perspektiv. Din vekt på datakvalitet avhenger av scenen av din store dataanalyse. Forvent ikke å kunne kontrollere datakvaliteten når du gjør din første analyse på store datamengder. Men når du begrenser dine store data for å identifisere en delmengde som er mest hensiktsmessig for organisasjonen din, er dette når du må fokusere på datakvalitet.
Til slutt blir datakvaliteten viktig hvis du vil at resultatene skal forstås i sammenheng med dine historiske data. Som firmaet stoler mer og mer på analyse som et nøkkelplanleggingsverktøy, kan datakvalitet bety forskjellen mellom suksess og fiasko.
-
Tenk på datakrav i sanntid. Store data vil gi streaming data til forkant. Derfor må du ha en klar forståelse av hvordan du integrerer data i bevegelse i ditt miljø for forutsigbar analyse.
-
Ikke opprett nye siloer av informasjon. Mens så mye fokus på store data er fokusert på Hadoop og andre ustrukturerte og halvstrukturerte kilder, husk at du må administrere disse dataene i sammenheng med virksomheten. Du må derfor integrere disse kildene med din forretningsdata og datalager.