Video: Big Data Governance challenges by Andrés García-Rodeja 2025
Datastyring er viktig for din bedrift, uansett hva dine store datakilder er eller hvordan de styres. I den tradisjonelle verden av datalager eller relasjonsdatabasebehandling er det sannsynlig at firmaet har godt forstått regler om hvordan data skal beskyttes.
For eksempel i helsevesenet er det viktig å holde pasientdata privat. Du kan kanskje lagre og analysere data om pasienter så lenge navn, personnummer og andre personopplysninger er maskert. Du må sørge for at uautoriserte personer ikke får tilgang til private eller begrensede data.
Hva skjer når du oversvømmer ditt miljø med store datakilder som kommer fra en rekke kilder? Noen av disse kildene kommer fra kommersielle tredjepartsleverandører som har nøye overvåket dataene og maskert ut sensitive data.
Det er imidlertid sannsynlig at de store datakildene kan være usikre og ubeskyttede, og inneholder mange personlige data. Under første behandling av disse dataene vil du sannsynligvis analysere masse data som ikke vil vise seg å være relevant for organisasjonen din. Derfor vil du ikke investere ressurser for å beskytte og styre data som du ikke har til hensikt å beholde.
Hvis sensitive personopplysninger passerer hele nettverket, kan du utsette firmaet for uventede krav til etterlevelse. For data som er virkelig undersøkende, med ukjent innhold, kan det være tryggere å utføre den første analysen i et "inngjerdet" miljø som er internt, men segmentert, eller i skyen.
Etter at du har bestemt deg for at en delmengde av dataene skal analyseres dypere, slik at resultatene kan inkorporeres i din forretningsprosess, er det viktig å sette inn en prosess for å nøye anvende styringsbehov på dataene.
Hvilke problemer bør du vurdere når du innlemmer disse ubevisste kildene i miljøet ditt? Vurder følgende:
-
Bestem på forhånd hvem som får tilgang til nye datakilder i utgangspunktet, så vel som etter at dataene har blitt analysert og forstått.
-
Forstå hvordan disse dataene vil bli adskilt fra andre selskapers data.
-
Forstå hva ditt ansvar er å utnytte dataene. Hvis dataene er privateide, må du sørge for at du overholder kontrakter eller bruksregler. Enkelte data kan være knyttet til en brukskontrakt med en leverandør.
-
Forstå hvor dataene dine vil være fysisk lokalisert. Du kan inkludere data som er knyttet til kunder eller potensielle kunder i bestemte land som har strenge personvernkrav.Du må være oppmerksom på detaljene i disse kildene for å unngå å bryte regelverket.
-
Forstå hvordan dataene dine må behandles hvis det fysisk flyttes fra ett sted til et annet. Skal du lagre noen av disse dataene med en skyleverandør? Hvilken type løfter vil leverandøren tilby når det gjelder hvor dataene skal lagres, og hvor godt vil det sikres?
Bare fordi du har opprettet en sikkerhets- og styringsprosess for dine tradisjonelle datakilder, betyr det ikke at du kan anta at ansatte og partnere vil utvide disse reglene til nye datakilder. Du må vurdere to viktige problemer: synlighet av dataene og tilliten til de som jobber med dataene.
-
Synlighet: Mens forretningsanalytikere og samarbeidspartnere du jobber med, kan du være ivrig etter å bruke disse nye datakildene, kan du ikke være klar over hvordan disse dataene blir brukt og kontrollert. Med andre ord har du kanskje ikke kontroll over synligheten din i ressursene dine som kjører utenfor din kontroll.
Denne situasjonen er spesielt vanskelig hvis du må sørge for at leverandøren din følger etterlevelsesforskrifter eller lover. Dette gjelder også når du bruker en skyleverandør til å administrere dataene fordi lagringen kan være veldig billig å administrere.
-
Uvitende ansatte: Selv om bedriften din kan gjennomgå en omfattende bakgrunnskontroll på alle sine ansatte, stoler du nå på at ingen ondsinnede innsidere jobber i ulike forretningsenheter utenfor IT. Du må også anta at skyen leverandøren har flittig sjekket sine ansatte.
Denne bekymringen er ekte fordi nesten 50 prosent av sikkerhetsbruddene skyldes innsidere. Hvis bedriften din skal bruke disse nye datakildene på en svært distribuert måte, må du ha en plan for å håndtere både indre og utvendige trusler.
Du har et ansvar for å sikre at de nye store datakildene ikke åpner firmaet for uventede trusler eller styringsrisiko. Det er ditt ansvar å ha god sikkerhet, styringsprosesser og utdanning på plass over hele ditt informasjonsstyringsmiljø.
Som med en hvilken som helst teknologi livssyklus, må du ha en prosess for å vurdere evne til organisasjonen din til å møte alle aktørers evne til å følge sikkerhets- og styringsbehov. Du kan allerede ha prosesser for datasikkerhet, personvern og styring på plass for eksisterende strukturerte databaser og datalager. Disse prosessene må utvides for din store dataimplementering.
