Video: Calling All Cars: Disappearing Scar / Cinder Dick / The Man Who Lost His Face 2025
Del av Prediktive Analytics for Dummies Cheat Sheet
Et vellykket predictive analytics-prosjekt utføres trinnvis. Når du fordyper deg i detaljene i prosjektet, må du se etter disse store milepæler:
-
Definere forretningsmål
Prosjektet starter med å bruke et veldefinert forretningsmål. Modellen skal adressere et forretningsspørsmål. Å klart si at målet vil gi deg mulighet til å definere omfanget av prosjektet, og gi deg den nøyaktige testen for å måle suksess.
-
Klargjøre data
Du bruker historiske data for å trene din modell. Dataene er vanligvis spredt over flere kilder og kan kreve rensing og forberedelse. Dataene kan inneholde dupliserte poster og utjevninger; Avhengig av analysen og forretningsmålet, bestemmer du om du vil beholde eller fjerne dem. Dataene kan også ha manglende verdier, må kanskje gjennomgå noe transformasjon, og kan brukes til å generere avledede attributter som har mer prediktiv kraft for målet ditt. Samlet sett indikerer kvaliteten på data kvaliteten på modellen.
-
Sampling av dataene dine
Du må dele dataene dine i to sett: trening og test datasett. Du bygger modellen ved hjelp av treningsdatasettet. Du bruker testdatasettet til å verifisere nøyaktigheten av modellens utgang. Å gjøre det er helt avgjørende. Ellers risikerer du at du overfører modellen din - trener modellen med et begrenset datasett, til det punktet at det plukker alle egenskapene (både signalet og støyen) som bare gjelder for det aktuelle datasettet. En modell som er overfitted for et bestemt datasett, vil utføre mislykket når du kjører det på andre datasett. Et testdatasett sikrer en gyldig måte å nøyaktig måle modellens ytelse på.
-
Noen ganger låner dataene eller forretningsmålene seg til en bestemt algoritme eller modell. Andre ganger er den beste tilnærmingen ikke så klar. Når du undersøker dataene, kjør så mange algoritmer som mulig. sammenlign sine utganger. Baser ditt valg av den endelige modellen på de samlede resultatene. Noen ganger er det bedre å kjøre et ensemble av modeller samtidig på dataene og velge en endelig modell ved å sammenligne sine utganger.
Implementere modellen
-
Etter å ha bygget modellen må du distribuere den for å høste fordelene. Denne prosessen kan kreve samordning med andre avdelinger. Sikt på å bygge en distribusjonsmodell. Vær også sikker på at du vet hvordan du skal presentere resultatene dine til bedriftens interessenter på en forståelig og overbevisende måte, slik at de adopterer modellen din.Etter at modellen er distribuert, må du overvåke ytelsen og fortsette å forbedre den. De fleste modeller forfaller etter en viss tidsperiode. Hold modellen oppdatert ved å forfriskne den med nylig tilgjengelige data.
