Video: Quantum Computers Explained – Limits of Human Technology 2025
Datautvinning gjøres ved prøving og feiling, og for data miners er det bare naturlig å lage feil. Feil kan være verdifull, med andre ord, i hvert fall under visse forhold. Ikke alle feil er opprettet lik, men. Noen er bare bedre unngått. Følgende liste inneholder ti slike feil. Hvis du leser dem nøye og forplikter dem til minne, kan du bare unngå noen støt på læringskurven:
-
Hopp over datakvalitetskontroller: De fleste data miners tror å utvikle prediktive modeller er morsommere enn å se på data for kvalitetsproblemer. Men hvis du ikke klarer å oppdage og rette problemer med datakvaliteten, kan du ende opp med verdiløse spådommer.
-
Mangler poenget: Du har oppdaget noe fascinerende! Det er fint, men hvis det ikke er også relevant for virksomhetsproblemet du setter opp for å løse, ja, det er ikke relevant i det hele tatt. Kom tilbake på sporet.
-
Å tro at et mønster i dataene viser et årsakssammenheng: Du undersøker et datasett og legger merke til at når Variabel A øker, øker variabel B også. Dette kan oppstå fordi Variabel A påvirker variabel B, eller fordi variabel B påvirker variabel A. På den annen side kan det være at begge er påvirket av noen andre variabler som du ikke har vurdert. Eller det kan være en engangs tilfeldighet. Hvem kan si?
-
Strekkende konklusjoner for langt: Forutsatt ikke at forholdene du observerer i data vil gjenta under forskjellige forhold. Hvis dataene dine ble samlet inn i et kjølig miljø, må du ikke anta at ting vil fungere på samme måte i en varm fabrikkinnstilling.
-
Spill på resultater som ikke gir mening: Data mining metoder er uformelle og ikke vanligvis sikkerhetskopiert av vitenskapelig metode og teori, slik at resultatene dine i det minste hadde vært bedre å gjøre forretningsmessig. Hvis det ikke er noen sunn fornuft forklaring på resultatene du presenterer, vil din daglig leder sannsynligvis ikke ta det på alvor, og de burde ikke.
-
Å bli forelsket i en bestemt modelleringsmetode: Det finnes ingen enkelt type data mining modell som passer til alle situasjoner.
-
Legge en modell i produksjon uten tilstrekkelig testing: Ikke bruk din virksomhet på en prediktiv modell før du har testet det med holdout data og i liten skala i feltet.
-
Ignorerer resultater du ikke liker: Hvis du ignorerer dataene dine nå, kommer den tilbake en dag og sier, "Jeg fortalte deg det.
-
Datautvinning har enorm verdi, men noen programmer krever fortsatt strenge datainnsamlingsmetoder, formell statistisk analyse og vitenskapelig metode. Forutsatt at tradisjonelle dataanalyseteknikker ikke lenger betyr noe:
-
Se forrige punktum.
![10 Vanlige data mining feil (som du ikke vil gjøre) - dummies <[SET:descriptionno] 10 Vanlige data mining feil (som du ikke vil gjøre) - dummies <[SET:descriptionno]](https://i.howtospotfake.org/img/3.jpg)