Innholdsfortegnelse:
- Oppgave: Identifisere dine forretningsmål
- Oppgave: Vurdere situasjonen din
- Oppgave: Definere data mining målene
- Oppgave: Produsere prosjektplanen din
Video: DATA SCIENCE ENTENDER O NEGÓCIO. CRISP-DM #FASE1 2025
Den Cross-Industry Standard Prosess for Data Mining ( CRISP-DM ) er den dominerende prosessrammen for data mining. I den første fasen av et data mining prosjekt, før du nærmer deg data eller verktøy, definerer du hva du skal utføre og definerer årsakene til at du vil oppnå dette målet.
Forretningsforståelsesfasen inkluderer fire oppgaver (primære aktiviteter, som hver kan innebære flere mindre deler).
Oppgave: Identifisere dine forretningsmål
Det første du må Gjør i et hvilket som helst prosjekt å finne ut nøyaktig hva du prøver å oppnå! Det er mindre åpenbart enn det høres ut. Mange data minearrangører har investert tid på dataanalyse, bare for å finne ut at deres ledelse ikke var spesielt interessert i problemet de var Du må starte med en klar forståelse av
-
Et problem som ledelsen ønsker å adressere.
-
The Forretningsmål
-
Begrensninger (begrensninger på hva du kan gjøre, hvilke løsninger som kan brukes, når arbeidet skal fullføres osv.)
-
Virkning (hvordan problemet og mulige løsninger passer inn i virksomheten)
Leveranser for denne oppgaven inkluderer tre elementer (vanligvis korte rapporter som fokuserer på bare hovedpoengene):
-
Bakgrunn: Forklar forretningssituasjonen som driver prosjektet. Dette elementet, som mange som følger, utgjør bare noen få avsnitt.
-
Forretningsmål: Definer hva organisasjonen har til hensikt å oppnå med prosjektet. Dette er vanligvis et bredere mål enn deg, som en datamengder, kan oppnå selvstendig. For eksempel kan forretningsmålet være å øke salget fra en ferieannonsekampanje med 10 prosent år over år.
-
Bedriftssuksesskriterier: Definer hvordan resultatene skal måles. Prøv å få klart definerte kvantitative suksess kriterier. Hvis du må bruke subjektive kriterier (hint: begreper som få innsikt eller få et håndtak på antyder subjektive kriterier), få minst enighet om nøyaktig hvem som vil bedømme om disse kriteriene har eller ikke blitt oppfylt.
Oppgave: Vurdere situasjonen din
Her får du mer informasjon om problemene knyttet til dine forretningsmål. Nå vil du gå dypere inn i feilsøking, bygge ut en mye fleshier forklaring på problemene som er skissert i forretningsmessige oppgaven.
Leveranser for denne oppgaven inkluderer fem grundige rapporter:
-
Resumé av ressurser: En liste over alle ressurser som er tilgjengelige for prosjektet.Disse kan omfatte personer (ikke bare data minearrangører, men også de med ekspertkunnskap om virksomhetsproblemet, datahåndtering, teknisk support og andre), data, maskinvare og programvare.
-
Krav, forutsetninger og begrensninger: Krav vil inneholde en tidsplan for ferdigstillelse, rettslige og sikkerhetsforpliktelser og krav til akseptabelt ferdig arbeid. Dette er poenget for å verifisere at du får tilgang til passende data!
-
Risiko og uforutsetninger: Identifiser årsaker som kan forsinke gjennomføring av prosjektet, og utarbeide en beredskapsplan for hver av dem. Hvis for eksempel et Internett-avbrudd på kontoret ditt kan utgjøre et problem, kan det hende at din nødsituasjon kan være å jobbe på et annet kontor inntil utgangen er avsluttet.
-
Terminologi: Lag en liste over forretningsbetingelser og data-mining vilkår som er relevante for prosjektet ditt og skriv dem ned i en ordliste med definisjoner (og kanskje eksempler), slik at alle involverte i prosjektet kan ha en felles forståelse av disse vilkårene.
-
Kostnader og fordeler: Forbered en kostnads / nytteanalyse for prosjektet. Prøv å oppgi alle kostnader og fordeler i dollar (euro, pund, yen og så videre). Hvis fordelene ikke overskrider kostnadene vesentlig, må du stoppe og revurdere denne analysen og prosjektet ditt.
Beslutningstakere føler seg ofte mer hensiktsmessige tildelte ressurser til prosjekter som reduserer kostnadene enn de som har til hensikt å øke inntektene, så alltid se etter kostnadsbesparelsespotensialet, og oppgi mulighetene for å spare penger først i kostnads- og ytelsesrapporten.
Oppgave: Definere data mining målene
Å nå forretningsmålet krever ofte handling fra mange mennesker, ikke bare data minearbejderen. Så nå må du definere din lille del i det større bildet. Hvis forretningsmålet er å redusere kundens slitasje, kan dine data-miningmål for eksempel være å identifisere slitasje for flere kundesegmenter, og utvikle modeller for å forutsi hvilke kunder som har størst risiko.
Leveranser til denne oppgaven inkluderer to rapporter:
-
Data mining mål: Definer data-mining leveranser, for eksempel modeller, rapporter, presentasjoner og behandlede datasett.
-
Suksesskriterier for datautvinning: Definer de tekniske kriteriene for data mining som er nødvendige for å støtte suksesskriteriene for virksomheten. Prøv å definere disse kvantitativt (for eksempel modellnøyaktighet eller prediktiv forbedring i forhold til en eksisterende metode). Hvis kriteriene må være kvalitative, må du identifisere personen som foretar vurderingen.
Oppgave: Produsere prosjektplanen din
Nå angir du hvert trinn du, datamaskingruven, har til hensikt å ta til prosjektet er fullført og resultatene presenteres og vurderes.
Leveranser for denne oppgaven inkluderer to rapporter:
-
Prosjektplan: Sett opp din trinnvise handlingsplan for prosjektet. Utvid oversikten med en tidsplan for gjennomføring av hvert trinn, nødvendige ressurser, innganger (for eksempel data eller et møte med en fagperson) og utdata (for eksempel rensede data, en modell eller en rapport) for hvert trinn, og avhengigheter (trinn som ikke kan starte før dette trinnet er fullført).Angiv eksplisitt at visse trinn må gjentas (for eksempel, modellering og evaluering kalles vanligvis for flere frem og tilbake gjentakelser).
-
Innledende vurdering av verktøy og teknikker: Identifiser de nødvendige evnene for å oppfylle data mining målene og vurdere verktøyene og ressursene du har. Hvis noe mangler, må du ta opp den bekymringen veldig tidlig i prosessen.
