Hjem Personlig finansiering Hva Data Miners Do dummies

Hva Data Miners Do dummies

Innholdsfortegnelse:

Video: Philip Evans: How data will transform business 2025

Video: Philip Evans: How data will transform business 2025
Anonim

Hvis du tenker på data som råmateriale, og informasjonen du kan få fra data som noe verdifull og relativt raffinert, kan prosessen med å trekke ut informasjon være sammenlignet med å trekke ut metall av malm eller edelstener fra smuss. Slik oppsto begrepet data mining .

Fokus på virksomheten til data mining

Data minearrangører overveier ikke bare data formålsløst, og håper å finne noe interessant. Hvert data-mining prosjektet begynner med et bestemt forretningsproblem og et mål å matche.

Som data minearrangør har du sannsynligvis ikke autoritet til å ta endelige forretningsavgjørelser, så det er viktig at du justerer arbeidet ditt med beslutningstakeres behov. Du må forstå deres problemer, behov og preferanser, og fokusere innsatsen på å gi informasjon som støtter gode forretningsbeslutninger.

Din egen virksomhetskunnskap er svært viktig. Ledere skal ikke sitte ved siden av deg mens du jobber, og gir tilbakemelding om relevansen av funnene dine til deres bekymringer. Du må bruke din egen erfaring og skikkelse til å bedømme det selv når du jobber.

Forstå hvordan data minearbeidere bruker sin tid

Det ville være flott hvis data minearbeidere kunne tilbringe hele dagen livsendrende funn, bygge verdifulle modeller og integrere dem i hverdagsbransjen. Men det er som å si at det ville være flott om idrettsutøvere kunne tilbringe hele dagen som vinner turneringer. Det tar mye forberedelser for å bygge opp til de triumfens øyeblikk. Så, som idrettsutøvere, bruker data miners mye tid på forberedelse.

Bli kjent med data mining prosessen

En god arbeidsprosess hjelper deg med å få mest mulig ut av din tid, dine data og alle dine andre ressurser. I denne boken finner du den mest populære data-mining prosessen, CRISP-DM. Det er en seks-fase syklus av oppdagelse og handling skapt av et konsortium av data minearbejdere fra mange bransjer, og en åpen standard som alle kan bruke.

Fasene i CRISP-DM-prosessen er

  1. Forretningsforståelse

  2. Dataforståelse

  3. Dataforberedelse

  4. Modeling

  5. Evaluering

  6. Distribusjon (ved bruk av modeller i hverdagsbransjen)

Hver Fasen bærer likevekt i betydning for kvaliteten på resultatene og verdien til virksomheten. Men når det gjelder tiden som er nødvendig, dominerer datapreparasjonen. Databehandling tar rutinemessig mer tid enn alle andre faser av data-mining prosessen kombinert.

Å gjøre modeller

Når målene blir forstått, og dataene er ryddet opp og klar til bruk, kan du gjøre oppmerksom på å bygge prediktive modeller.Modeller gjør hvilke rapporter som ikke kan; de gir deg informasjon som støtter handling.

En rapport kan fortelle deg at salget er nede. Det kan ødelegge salget etter region, produkt og kanal, slik at du vet hvor salget ble avslått, og om disse nedleggingene var utbredt eller bare påvirket bestemte områder. Men de gir deg ingen ledetråder om hvorfor salgene avslått eller hvilke tiltak som kan bidra til å gjenopplive virksomheten.

Modeller hjelper deg med å forstå de faktorene som påvirker salget, handlingene som har en tendens til å øke eller redusere salget, og strategier og taktikker som gjør at virksomheten din går jevnt. Det er spennende, ikke sant? Kanskje det er derfor de fleste datamaskiner vurderer modellering for å være den morsomme delen av jobben.

Forstå matematiske modeller

Matematiske modeller er sentrale for data mining, men hva er de? Hva gjør de, hvordan fungerer de, og hvordan blir de opprettet?

En matematisk modell er ren og enkel, en ligning eller sett av ligninger som beskriver forholdet mellom to eller flere ting. Slike ligninger er korte for teorier om naturens og samfunnets arbeid. Teorien kan støttes av et betydelig bevismateriale, eller det kan bare være en vill gjetning. Matematikkens språk er det samme i begge tilfeller.

Vilkår som prediktiv modell, statistisk modell, eller lineær modell refererer til spesifikke typer matematiske modeller, navnene som reflekterer den tilsiktede bruken, skjemaet eller metoden for utledning en bestemt modell. Disse tre eksemplene er bare noen få av mange slike begreper.

Når en modell er nevnt i en forretningsinnstilling, er det sannsynligvis en modell som brukes til å foreta spådommer. Modeller brukes til å forutsi aksjekurser, produktsalg og arbeidsledighet blant mange andre ting.

Disse forutsigelsene kan eller ikke være nøyaktige, men for et gitt sett av verdier (kjente faktorer som disse kalles uavhengige variabler eller innganger ) som er inkludert i modellen, vil du finn en veldefinert prediksjon (også kalt en avhengig variabel, utgang, eller resultat ). Matematiske modeller brukes også til andre formål i virksomheten, for eksempel å beskrive arbeidsmekanismer som driver en bestemt prosess.

I data mining lager du modeller ved å finne mønstre i data ved hjelp av maskinlæring eller statistiske metoder. Data minearbejdere følger ikke den samme strenge tilnærmingen som klassiske statistikere gjør, men alle modeller er avledet fra faktiske data og konsistente matematiske modelleringsteknikker. Alle data-mining modeller støttes av en kropp av bevis.

Hvorfor bruke matematiske modeller? Kunne ikke de samme forholdene beskrives ved hjelp av ord? Det er mulig, men likevel finner du visse fordeler ved bruk av ligninger. Disse inkluderer

  • Convenience: Sammenlignet med tilsvarende beskrivelser skrevet i setninger, er ligninger korte. Matematisk symbolikk har utviklet seg spesielt for å representere matematiske relasjoner; språk som engelsk har ikke.

  • Klarhet: Likninger formidler kortfattede ideer og er entydige.De er ikke underlagt ulike tolkninger basert på kultur, og symbolikken i matematikk er et slags felles språk som brukes over hele verden.

  • Konsistens: Fordi matematiske representasjoner er entydige, er implikasjonene av en bestemt situasjon klart definert av en matematisk modell.

Sette inn informasjon til handling

En modell gir bare verdi når du bruker den i virksomheten. En modells spådommer kan støtte beslutningsprosesser på en rekke måter. Du kan

  • inkludere spådommer til en rapport eller presentasjon som skal brukes til å ta en bestemt beslutning.

  • Integrer modellen i et operativsystem (for eksempel et kundeservice-system) for å gi sanntidsprognose for daglig bruk. (For eksempel kan du flagge forsikringskrav for umiddelbar betaling, umiddelbar benektelse eller videre undersøkelse.)

  • Bruk modellen for batch-spådommer. (For eksempel kan du score den interne kundelisten for å bestemme hvilke kunder som skal motta et bestemt tilbud.)

Hva Data Miners Do dummies

Redaktørens valg

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

Hvordan beskrives et datasett statistisk for GEDs vitenskapstest - dummies

GED Science test vil stille spørsmål relatert til beskrivende statistikk. Du kan ofte oppsummere en samling av data (fra et eksperiment, observasjoner eller undersøkelser, for eksempel) ved å bruke beskrivende statistikk, tall som brukes til å oppsummere og analysere dataene og trekke konklusjoner fra det. Beskrivende statistikk for en samling av data inkluderer følgende: Frekvens: ...

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Hvordan forutsi en utgang basert på data eller bevis på GED-vitenskapstesten

Bruk av bevis for å forutsi utfall er en nødvendig ferdighet for GED Science-testen. De største fordelene med vitenskapelige studier kan ofte tilskrives det faktum at deres konklusjoner gjør det mulig for folk å forutsi utfall. (Du vil sikkert ønske vitenskap kan hjelpe deg med å forutsi utfallet ditt på prøve!) Du er vitne til vitenskap i handling hver dag ...

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

Hvordan man måler en forfatters troverdighet for GEDs samfunnsstudietest - dummies

GED Social Studies test vil stille spørsmål som krever at du bestemmer troverdigheten til en forfatter. Det er ikke alltid lett å vurdere om en forfatter er troverdig basert på informasjonen som er gitt i en skriftlig oversikt og referansen, men du kan hente spor ved å nøye undersøke følgende områder: Forfatterens ...

Redaktørens valg

Hva skjer i QuickBooks 2013 Setup? - dummies

Hva skjer i QuickBooks 2013 Setup? - dummies

Etter at du har installert QuickBooks 2013, kjører du en skjermveiviser for å sette opp QuickBooks for firmaets regnskap. Klart, denne skjermveiviseren kalles QuickBooks Setup. Når du kjører QuickBooks Setup, gir du ganske mye informasjon til QuickBooks. Som en praktisk sak krever oppsettet og oppsettet etter oppsettet at du har ...

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Leverandørmenykommandoer i QuickBooks 2013 - dummies

Når du jobber med betalbar betaling i QuickBooks 2013, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter i QuickBooks 2013 Vendor Center-vinduet viser en liste over leverandører og detaljerte ...

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Kommandoer for leverandørmeny i QuickBooks 2014 - dummies

Når du jobber med betalbar betaling i QuickBooks 2014, har du ofte vil bruke flere av kommandoene på leverandørmenyen. Noen av kommandoene er imidlertid ikke så populære, men du må fortsatt være klar over deres formål. Leverandørssenter Vendor Center-vinduet viser en liste over leverandører og detaljert leverandørinformasjon for ...