Video: Basic Machine Learning Algorithms Overview - Data Science Crash Course Mini-series 2025
Ved Meta S. Brown
Data mining er måten alminnelige forretningsmenn bruker en rekke dataanalyse teknikker for å avdekke nyttig informasjon fra data og sette denne informasjonen i praktisk bruk. Data minearrangører ikke oppstyr over teori og antagelser. De bekrefter deres funn ved testing. Og de forstår at ting forandres, så da funnene som fungerte som en sjarm i går, ikke holder seg i dag, tilpasser de seg.
De 9 lovene om data mining: En referansehåndbok
Pioneer data minearbejder Thomas Khabaza utviklet sin "Ni Data Data Mining" for å veilede nye data miners som de kommer ned til jobb. Denne referanseguideen viser deg hva hver av disse lovene betyr for ditt daglige arbeid.
-
Første lov om data mining, eller "Business Laws": Forretningsmål er opprinnelsen til hver data mining løsning.
En datagruper er noen som oppdager nyttig informasjon fra data for å støtte bestemte forretningsmål. Data mining er ikke definert av verktøyet du bruker.
-
2. Lov om datavinning, eller "Business Knowledge Law": Forretningskunnskap er sentral for hvert trinn i data mining prosessen .
Du trenger ikke å være en fin statistiker for å gjøre datautvinning, men du må vite noe om hva dataene betyr og hvordan virksomheten fungerer.
-
tredje lov om data mining eller "data forberedelse lov": Data forberedelse er mer enn halvparten av hver data mining prosess .
Ganske mye vil alle datamengder bruke mer tid på dataforberedelse enn på analyse.
-
Fjerde lov om data mining, eller "Ingen gratis lunsj for datamaskinen": Den riktige modellen for en gitt applikasjon kan bare oppdages ved eksperiment .
I data mining blir modeller valgt gjennom prøve og feil.
-
5. Lov om data mining: Det er alltid mønstre i dataene .
Som datamengder undersøker du data på jakt etter nyttige mønstre. Forståelse av mønstre i dataene gjør at du kan påvirke hva som skjer i fremtiden.
-
6. Lov om data mining, eller "Insight Law": Data mining forsterker oppfatningen i bedriftsdomenet .
Data mining metoder gjør at du kan forstå din bedrift bedre enn du kunne ha gjort uten dem.
-
7: e Data Mining eller "Prediction Law": Prediksjon øker informasjon lokalt ved generalisering.
Data mining hjelper oss å bruke det vi vet for å gjøre bedre spådommer (eller estimater) av ting vi ikke vet.
-
8. Lov om datavinnning, eller "Verdilov": Verdien av datautvinningsresultater er ikke bestemt av nøyaktigheten eller stabiliteten til prediktive modeller .
Modellen din må produsere gode spådommer, konsekvent. Det er det.
-
9. lov om data mining, eller "lov om endring": Alle mønstre kan endres.
Enhver modell som gir deg gode spådommer i dag, kan være ubrukelig i morgen.
Datainnsamlingsfasens faser
Standardprosessen for Datavinnning ( CRISP-DM ) er den dominerende data-miningprosessrammen. Det er en åpen standard; alle kan bruke den. Følgende liste beskriver de forskjellige fasene i prosessen.
-
Bedriftsforståelse: Få en klar forståelse av problemet du er ute etter å løse, hvordan det påvirker organisasjonen din, og målene dine for å takle det. Oppgaver i denne fasen inkluderer:
-
Identifisere dine forretningsmål
-
Vurdere situasjonen din
-
Definere data mining målene
-
Produsere prosjektplanen din
-
-
Dataforståelse: Gjennomgå dataene du har, dokumentere det, identifisere datahåndtering og datakvalitetsproblemer. Oppgaver for denne fasen inkluderer:
-
Samle data
-
Beskriv
-
Utforsking
-
Verifiserer kvalitet
-
-
Data forberedelse: Få dataene dine klare til bruk for modellering. Oppgaver for denne fasen inkluderer:
-
Valg av data
-
Rengjør data
-
Konstruksjon
-
Integrasjon
-
Formatering
-
-
Modeling: Bruk matematiske teknikker til å identifisere mønstre i dataene dine. Oppgaver for denne fasen inkluderer:
-
Valg av teknikker
-
Utforming av tester
-
Byggemodeller
-
Vurdering av modeller
-
-
Evaluering: Gjennomgå mønstrene du har oppdaget og vurder deres potensial for forretningsbruk. Oppgaver for denne fasen inkluderer:
-
Evaluering av resultatene
-
Gjennomgang av prosessen
-
Bestemme de neste trinnene
-
-
Distribusjon: Sett funnene dine til jobb i hverdagsbransjen. Oppgaver for denne fasen inkluderer:
-
Planlegging distribusjon (dine metoder for å integrere data mining funn i bruk)
-
Rapportere endelige resultater
-
Gjennomgang av endelige resultater
-
