Risikomodellering er en annen viktig brukstilstand som er utnyttet av Hadoop. Du vil oppdage at det nærmer seg brukssaken til bedrageringsdetektering ved at det er en modellbasert disiplin. Jo flere data du har og jo mer du kan "koble prikkene", jo oftere vil resultatene gi bedre risikovurderingsmodeller.
Det altomfattende ordet risiko kan ha mange betydninger. For eksempel er kundefordelingsprognose risikoen for at en klient flytter til en konkurrent; risikoen for en lånebok relaterer seg til risikoen for mislighold; risiko i helsevesenet spenner fra spekteret fra utbrudd av inneslutninger til mattrygghet til sannsynligheten for reinfeksjon og mer.
Finanssektoren (FSS) investerer nå sterkt i Hadoop-basert risikomodellering. Denne sektoren søker å øke automatiseringen og nøyaktigheten av risikovurderingen og eksponeringsmodelleringen. Hadoop tilbyr deltakerne muligheten til å utvide datasettene som brukes i deres risikomodeller for å inkludere underutnyttede kilder (eller kilder som aldri blir brukt), for eksempel e-post, direktemeldinger, sosiale medier og samhandling med kundeservice representanter, blant annet datakilder.
Når et selskap utsteder en forsikring mot naturkatastrofer hjemme, ser en utfordring tydelig ut hvor mye penger potensielt er i fare. Hvis forsikringsselskapet ikke reserverer penger for mulige utbetalinger, vil regulatorer gripe inn (forsikringsselskapet vil ikke ha det); Hvis forsikringsselskapet legger for mye penger inn i sine reserver for å utbetale fremtidige politikkkrav, kan de ikke investere premiepengene dine og tjene penger (forsikringsselskapet vil heller ikke ha det).
Disse selskapene har ganske enkelt problemer med å teste deres risikomodeller. Muligheten til å kaste inn flere data - for eksempel værmønstre eller den stadig skiftende sosioøkonomiske fordeling av klientbase - gir dem mye mer innsikt og evne når det gjelder å bygge bedre risikomodeller.
Bygg og stress-testing risikomodeller som den nettopp beskrevet er en ideell oppgave for Hadoop. Disse operasjonene er ofte beregningsmessige dyrt, og når du bygger en risikomodell, sannsynligvis upraktisk å løpe mot et datalager, av disse grunner:
Lageret er sannsynligvis ikke optimalisert for de ulike spørsmålene som utstedes av risikomodellen.(Hadoop er ikke bundet av datamodellene som brukes i datalagring.)
-
En stor ad hoc-batchjobb som en utviklende risikomodell vil legge til last i lageret, og påvirke eksisterende analytiske applikasjoner. (Hadoop kan anta denne arbeidsbelastningen, frigjøre lageret for regelmessig forretningsrapportering.)
-
Mer avanserte risikomodeller må kanskje faktor i ustrukturert data, for eksempel rå tekst. (Hadoop kan håndtere oppgaven effektivt.)
