Forebygging av datasikkerhetskatastrofer - dummies

Video: Forebygging av trykkrelaterte skader og trykksår 2024

Datasikkerhet er et stort problem for data miners. Nyhetsrapporter som beskriver nivået på personopplysninger i hendene på den amerikanske regjeringens sikkerhetsbyrå og brudd på kommersielle datakilder har økt offentlig bevissthet og bekymring.

Et sentralt konsept i personvern er personlig identifiserbar informasjon (PII), eller data som kan spores til den enkelte personen den beskriver. PII inneholder åpenbare identifikatorer som navn, kredittkortnummer og personnummer, og de fleste datavinnere er godt klar over at denne typen data er privat og må håndteres med forsiktighet. Men PII refererer til mer enn bare disse åpenbare identifikatorene.

Eventuelle data som kan brukes til å identifisere en person, selv om det krever at man bruker flere felt i kombinasjon eller manipulerer dataene på en eller annen måte, er også PII. Det er lett for data minearrangører å overse denne typen data, den typen som ikke vises på overflaten for å være privat, og likevel kan være tilstrekkelig for personlig identifikasjon dersom den ble manipulert for det formålet. Hvis det er noen måte at data kan manipuleres for å identifisere personer, må det håndteres med de samme forholdsregler som du vil gi en liste over kredittkortnumre.

Det er her data minearbejdere lett kan komme seg i vanskeligheter. Det er mange måter å identifisere personer på hvis du gjør en liten innsats for å gjøre det. I et bemerkelsesverdig eksempel utgav AOL Research brukeresøkregister for forskningsbruk. Dataene var ment å være anonyme, det var ingen navn i den, men The New York Times rapporterte at det hadde vært i stand til å identifisere et individ fra søkedata ved kryssreferanse med telefonoppføringer. Senere gjorde Netflix filmdata tilgjengelig for bruk i en konkurranse, og det ble snart avslørt at disse dataene også kunne brukes til å identifisere personer.

I arbeidet som data minearrangør kan du ha erfaringer med potensielle kunder som delte data de hevdet var anonym (eller til og med faknet, for å illustrere et diskusjonspunkt), men fant at dataene var ingenting av den sort. Vitenskapelig eller ikke bryter disse personene lov om personvern og viser mangel på respekt for sine egne kunder.

Så hvordan kan du forhindre katastrofer som disse? Ikke prøv å gjøre det alene. Det er utfordrende å sikre overholdelse av all relevant personvernlovgivning, for ikke å nevne andre gode forretningspraksis. Jenny Juliany, direktør for løsningerarkitektur og medstifter av Intreis, en løsningsintegrator som spesialiserer seg på serviceadministrasjon og complianceautomatisering, beskriver livssyklusen av data med en analogi til de fire årstidene:

Vår: Oppstart, dataene er opprettet.
Sommer: Primetime, dataene er i aktiv bruk.
Fall: Pensjonering, dataene er ikke lenger relevante eller brukt, men det kan være juridiske eller andre grunner til å beholde det.
Vinter: Fjerning, dataene blir ødelagt.

Hver sesong har sine egne egenskaper, med forskjellige krav om personvern. Noen er jordet i loven, andre i sunn fornuft, og fortsatt andre i individuelle avtaler med kunder og din egen arbeidsgivers forretningspraksis. Det er ikke realistisk å tro at du kan ta på alle disse overholdelsesdetaljer i tillegg til din primære rolle, så du må samarbeide med organisasjonens datahåndteringspersonell.

Du vil ikke være midtpunktet i den neste store datasikkerhetsskandalen. Respekt for personvern og riktig dataadministrasjon er nøkkelen til å minimere risikoen. Ikke vent til noe går galt, kontakt personvernseksperten i din egen organisasjon i dag, og begynn å bygge et samarbeidspartnerskap for å administrere sensitive data på riktig måte.

Flere detaljer om data livscyklus fra Jenny Juliany på Four Seasons of Data Management finner du her: