Innholdsfortegnelse:
- Fokus på virksomheten til data mining
- Forstå hvordan data minearbeidere bruker sin tid
- Bli kjent med data mining prosessen
- Å gjøre modeller
- Forstå matematiske modeller
- Sette inn informasjon til handling
Video: Philip Evans: How data will transform business 2025
Hvis du tenker på data som råmateriale, og informasjonen du kan få fra data som noe verdifull og relativt raffinert, kan prosessen med å trekke ut informasjon være sammenlignet med å trekke ut metall av malm eller edelstener fra smuss. Slik oppsto begrepet data mining .
Fokus på virksomheten til data mining
Data minearrangører overveier ikke bare data formålsløst, og håper å finne noe interessant. Hvert data-mining prosjektet begynner med et bestemt forretningsproblem og et mål å matche.
Som data minearrangør har du sannsynligvis ikke autoritet til å ta endelige forretningsavgjørelser, så det er viktig at du justerer arbeidet ditt med beslutningstakeres behov. Du må forstå deres problemer, behov og preferanser, og fokusere innsatsen på å gi informasjon som støtter gode forretningsbeslutninger.
Din egen virksomhetskunnskap er svært viktig. Ledere skal ikke sitte ved siden av deg mens du jobber, og gir tilbakemelding om relevansen av funnene dine til deres bekymringer. Du må bruke din egen erfaring og skikkelse til å bedømme det selv når du jobber.
Forstå hvordan data minearbeidere bruker sin tid
Det ville være flott hvis data minearbeidere kunne tilbringe hele dagen livsendrende funn, bygge verdifulle modeller og integrere dem i hverdagsbransjen. Men det er som å si at det ville være flott om idrettsutøvere kunne tilbringe hele dagen som vinner turneringer. Det tar mye forberedelser for å bygge opp til de triumfens øyeblikk. Så, som idrettsutøvere, bruker data miners mye tid på forberedelse.
Bli kjent med data mining prosessen
En god arbeidsprosess hjelper deg med å få mest mulig ut av din tid, dine data og alle dine andre ressurser. I denne boken finner du den mest populære data-mining prosessen, CRISP-DM. Det er en seks-fase syklus av oppdagelse og handling skapt av et konsortium av data minearbejdere fra mange bransjer, og en åpen standard som alle kan bruke.
Fasene i CRISP-DM-prosessen er
-
Forretningsforståelse
-
Dataforståelse
-
Dataforberedelse
-
Modeling
-
Evaluering
-
Distribusjon (ved bruk av modeller i hverdagsbransjen)
Hver Fasen bærer likevekt i betydning for kvaliteten på resultatene og verdien til virksomheten. Men når det gjelder tiden som er nødvendig, dominerer datapreparasjonen. Databehandling tar rutinemessig mer tid enn alle andre faser av data-mining prosessen kombinert.
Å gjøre modeller
Når målene blir forstått, og dataene er ryddet opp og klar til bruk, kan du gjøre oppmerksom på å bygge prediktive modeller.Modeller gjør hvilke rapporter som ikke kan; de gir deg informasjon som støtter handling.
En rapport kan fortelle deg at salget er nede. Det kan ødelegge salget etter region, produkt og kanal, slik at du vet hvor salget ble avslått, og om disse nedleggingene var utbredt eller bare påvirket bestemte områder. Men de gir deg ingen ledetråder om hvorfor salgene avslått eller hvilke tiltak som kan bidra til å gjenopplive virksomheten.
Modeller hjelper deg med å forstå de faktorene som påvirker salget, handlingene som har en tendens til å øke eller redusere salget, og strategier og taktikker som gjør at virksomheten din går jevnt. Det er spennende, ikke sant? Kanskje det er derfor de fleste datamaskiner vurderer modellering for å være den morsomme delen av jobben.
Forstå matematiske modeller
Matematiske modeller er sentrale for data mining, men hva er de? Hva gjør de, hvordan fungerer de, og hvordan blir de opprettet?
En matematisk modell er ren og enkel, en ligning eller sett av ligninger som beskriver forholdet mellom to eller flere ting. Slike ligninger er korte for teorier om naturens og samfunnets arbeid. Teorien kan støttes av et betydelig bevismateriale, eller det kan bare være en vill gjetning. Matematikkens språk er det samme i begge tilfeller.
Vilkår som prediktiv modell, statistisk modell, eller lineær modell refererer til spesifikke typer matematiske modeller, navnene som reflekterer den tilsiktede bruken, skjemaet eller metoden for utledning en bestemt modell. Disse tre eksemplene er bare noen få av mange slike begreper.
Når en modell er nevnt i en forretningsinnstilling, er det sannsynligvis en modell som brukes til å foreta spådommer. Modeller brukes til å forutsi aksjekurser, produktsalg og arbeidsledighet blant mange andre ting.
Disse forutsigelsene kan eller ikke være nøyaktige, men for et gitt sett av verdier (kjente faktorer som disse kalles uavhengige variabler eller innganger ) som er inkludert i modellen, vil du finn en veldefinert prediksjon (også kalt en avhengig variabel, utgang, eller resultat ). Matematiske modeller brukes også til andre formål i virksomheten, for eksempel å beskrive arbeidsmekanismer som driver en bestemt prosess.
I data mining lager du modeller ved å finne mønstre i data ved hjelp av maskinlæring eller statistiske metoder. Data minearbejdere følger ikke den samme strenge tilnærmingen som klassiske statistikere gjør, men alle modeller er avledet fra faktiske data og konsistente matematiske modelleringsteknikker. Alle data-mining modeller støttes av en kropp av bevis.
Hvorfor bruke matematiske modeller? Kunne ikke de samme forholdene beskrives ved hjelp av ord? Det er mulig, men likevel finner du visse fordeler ved bruk av ligninger. Disse inkluderer
-
Convenience: Sammenlignet med tilsvarende beskrivelser skrevet i setninger, er ligninger korte. Matematisk symbolikk har utviklet seg spesielt for å representere matematiske relasjoner; språk som engelsk har ikke.
-
Klarhet: Likninger formidler kortfattede ideer og er entydige.De er ikke underlagt ulike tolkninger basert på kultur, og symbolikken i matematikk er et slags felles språk som brukes over hele verden.
-
Konsistens: Fordi matematiske representasjoner er entydige, er implikasjonene av en bestemt situasjon klart definert av en matematisk modell.
Sette inn informasjon til handling
En modell gir bare verdi når du bruker den i virksomheten. En modells spådommer kan støtte beslutningsprosesser på en rekke måter. Du kan
-
inkludere spådommer til en rapport eller presentasjon som skal brukes til å ta en bestemt beslutning.
-
Integrer modellen i et operativsystem (for eksempel et kundeservice-system) for å gi sanntidsprognose for daglig bruk. (For eksempel kan du flagge forsikringskrav for umiddelbar betaling, umiddelbar benektelse eller videre undersøkelse.)
-
Bruk modellen for batch-spådommer. (For eksempel kan du score den interne kundelisten for å bestemme hvilke kunder som skal motta et bestemt tilbud.)
