Data mining - dummies - Personlig finansiering 2025

Kjernegenskapen om datautvinning, sammenlignet med spørring, rapportering eller OLAP, er at du kan få informasjon uten å måtte stille bestemte spørsmål.

Data mining tjener to primære roller i ditt forretningsmessige oppdrag:

"Fortell meg hva som kan skje" rolle: Data mining er den første rollen som er prediktiv, der du i utgangspunktet sier "Fortell meg hva kan skje. "Ved å bruke skjult kunnskap låst i datalageret, sannsynliggjøres sannsynligheten for fremtidige trender og hendelser og presenteres for deg.
I tillegg til mulige fremtidige hendelser og hendelser, prøver datautvinning også å trekke ut interessante opplysninger som du sikkert bør vite om, for eksempel et spesielt uvanlig sammenheng mellom salg av to forskjellige produkter og hvordan forholdet varierer etter plassering i butikkene dine. Selv om mange av disse interessante godbitene er sannsynlig å eksistere, hvilke spørsmål vil du spørre om du brukte et spørrings- eller OLAP-verktøy, og hvordan ville du tolke resultatene? Data mining hjelper deg i denne vanskelige oppgaven med å finne ut hvilke spørsmål du skal stille ved å gjøre mye av det grunne arbeidet for deg.

Registrering av svindel

Bestemme effektiviteten av markedsføringsprogrammet

Valg av hvem fra en stor kundebase eller den generelle befolkningen, bør du målrette som en del av et markedsføringsprogram

Administrere kundens livssyklus, inkludert kundetilfredshetsoppdraget
Utføre avansert forretningsprosessmodellering og hva-om-scenarier
Tenk på hva som ligger bak hver av forretningsoppdragene i den forrige listen:
En stor mengde data
En enda større antall kombinasjoner av ulike datamaterialer
Intensiv resultatanalyse, som vanligvis involverer komplekse algoritmer og avanserte statistiske teknikker

Nå tenk på hva du må gjøre hvis du bruker et rapporterings- eller OLAP-verktøy for å oppnå disse oppdragene. Du vil finne det praktisk talt umulig å utføre noen av de foregående oppdragene grundig hvis du måtte stille et spørsmål og få et resultat, stille et annet spørsmål og få et nytt resultat, og fortsett å gjenta disse trinnene.

Data mining og kunstig intelligens
Hvis du har vært i IT-feltet i minst et tiår, kan noen av de foregående vilkårene være svakt kjent.Lås opp skjult kunnskap? Prediktiv funksjonalitet? Vent litt - det er kunstig intelligens!
Fra de tidligste dagene av kommersiell databehandling har det vært stor interesse for å utvikle "tankemaskiner" som kan behandle store mengder data og ta beslutninger basert på denne analysen.

Interessen for kunstig intelligens (AI) rammet sin høyde i midten av 1980-tallet. På den tiden jobbet databaseleverandørene med å produsere kunnskapsbaserte styringssystemer (KBMSs); Andre leverandører kom ut med

ekspertsystemskall,

eller AI-baserte applikasjonsutviklingsrammer som brukte teknikker som forkjeding og tilbakeketting for å gi brukerne råd om beslutninger; og nevrale nettverk ble plassert som den neste store AI-utviklingen.

Interesse i AI gikk ned tidlig på 1990-tallet, da forventningene overgikk tilgjengelige muligheter og andre frenzier, for eksempel klient / server migrasjon og (selvfølgelig) datalagring, tok senterstadiet.

Nå er AI tilbake! Den høyest profilerte AI-teknikken som brukes i data mining er nevrale nettverk. Neuralnett var opprinnelig tenkt som en behandlingsmodell som ville etterligne måten menneskelig hjerne løser problemer ved hjelp av nevroner og høy parallell behandling for å gjøre mønsterløsning. Bruk av nevrale nettverksalgoritmer til områdene business intelligence som data mining håndterer (igjen, forutsigbar og "fortell meg noe interessant" oppdrag) ser ut til å være en naturlig kamp.

Selv om data mining / neurale nettverksspillet definitivt er verdt å sjekke inn, bør du gjøre det nøye. Du finner mange interessante og spennende teknologier som i hendene på de som ikke forstår algoritmene, sannsynligvis vil mislykkes.

Med riktig kunnskap og utdanning kan du imidlertid gjøre en fullstendig forpliktelse til å bringe denne typen behandling inn i forretningsinformasjonsrammen din som teknisk analyseparing for OLAP-fokusert forretningsanalyse.

Data mining og statistikk

Den mer modne delen av data mining er anvendelsen av avanserte statistiske teknikker mot de store datamengdene i datalagret ditt. Ulike verktøy bruker ulike typer statistiske teknikker, skreddersydd til de områdene de prøver å adressere.

Uten en statistisk bakgrunn, kan det hende du finner mye av data mining forvirrende. Du må gjøre mye arbeid for å trene algoritmer og bygge reglene for å sikre riktige resultater med større datasett. Hvis du forventer at du er komfortabel med dette konseptet, eller har en kollega som kan hjelpe, er det noen av de mer utbredte algoritmene:

Klassifikasjonsalgoritmer:

Forutsi en eller flere diskrete variabler, basert på den andre attributter i datasettet. Ved å bruke klassifikasjonsalgoritmer kan datautvinningsverktøyet se på store mengder data og informere deg om at for eksempel "Kunder som beholdes gjennom minst to generasjoner av produktkjøp har en tendens til å ha disse egenskapene: De har en inntekt på minst $ 75 000, og de eier sine egne hjem."

Regresjonsalgoritmer:

Forutsi en eller flere kontinuerlige variabler, for eksempel fortjeneste eller tap, basert på andre attributter i datasettet. Regresjonsalgoritmer drives av historisk informasjon presentert til data mining verktøyet "over tid," bedre kjent som

tidsserier informasjon.
Segmenteringsalgoritmer: Del data i grupper eller klynger av elementer som har lignende egenskaper. Forening algoritmer: Finn korrelasjoner mellom forskjellige attributter i et datasett. Den vanligste bruken av denne typen algoritme skaper foreningsregler, som du kan bruke i en markedskurvanalyse. Merk at for eksempel hvis en kunde kjøper en bestemt programvarepakke, har han eller hun 65 prosent sjanse til å kjøpe minst to produktspesifikke tilleggspakker innen to uker.
Sekvensanalysalgoritmer: Oppsummer hyppige sekvenser eller episoder i data, for eksempel en web-sti-strømning.
Det finnes mange flere metoder. Støv av den gamle statistikkboken og begynn å lese.