Hjem Personlig finansiering Velge riktig algoritme for maskinlæring

Velge riktig algoritme for maskinlæring

Video: Why The YouTube Algorithm Will Always Be A Mystery 2025

Video: Why The YouTube Algorithm Will Always Be A Mystery 2025
Anonim

Del av maskinlæring for dummier Cheat Sheet < Maskinlæring innebærer bruk av mange forskjellige algoritmer. Denne tabellen gir deg et raskt sammendrag av styrker og svakheter i ulike algoritmer.

Algoritme

Best på Fordeler Ulemper Tilfeldig skog
Apt på nesten alle maskinlæringsproblemer Bioinformatikk

Kan fungere parallelt

Sjelden overfits > Håndterer manglende verdier automatisk

Ikke nødvendig å omdanne noen variabel

Ikke nødvendig å justere parametere

Kan brukes av nesten alle med gode resultater

Vanskelig å tolke

Svakere på regresjon når man estimerer verdier ved ekstremiteter av fordelingen av responsverdier

Forskjellige i multiklasseproblemer mot hyppigere klasser

Gradient Boosting

Apt på nesten alle maskinlæringsproblemer

Søkemotorer (løse problemet med å lære å rangere) > Det kan omtrentliggjøre mest ikke-lineære funksjonen. Best i klassens spådommer

Håndter automatisk manglende verdier

Ikke nødvendig å omdanne noen variabel

Det kan overfit hvis det kjører for mange iterasjoner

Følsomt for støyende data og outliers

Fungerer ikke bra uten parameterinnstilling

Linjær regresjon

Baseline predic

Økonometriske forutsetninger

Modellering av markedsresponser Enkel å forstå og forklare

Det overgår sjelden

Bruk av L1 og L2-regulering er effektiv i funksjonsvalg

Rask til trening

Lett å trene på store data takket være sin stokastiske versjon

Du må jobbe hardt for å få det til å passe til ikke-lineære funksjoner.

Kan lider av utelatere.

Støtte vektormaskiner

Tegngjenkjenning

Bildegjenkjenning

Tekst klassifisering Automatisk ikke-lineær funksjonalisering

Kan omtrentlige komplekse, ikke-lineære funksjoner

Vanskelig å tolke ved bruk av ikke-lineære kjerner

Lider av for mange eksempler. Etter 10 000 eksempler begynner det å ta for lang tid å trene

K-nærmeste naboer

Datasyn

Multilabel-tagging

Anbefalingssystemer Stavekontrollproblemer

Rask, lat trening

Kan selvfølgelig håndtere ekstreme multiklassproblemer (som merking av tekst)

Sakte og besværlig i forutsigelsesfasen

Kan ikke forutsi korr

Adaboost

Ansiktsgjenkjenning

Håndterer manglende verdier automatisk

Ikke nødvendig å omdanne noen variabel Det overlater ikke lett Få parametere til å justere > Naive Bayes

Ansiktsgjenkjenning

Sentimentanalyse

Spam deteksjon

Det er mulig å utnytte mange forskjellige svake elever. Tekstklassifisering

Enkel og rask å implementere, krever ikke for mye minne og kan brukes til nettbasert læring

Enkel å forstå

Tager hensyn til forkunnskaper Sterke og urealistiske funn uavhengighetsforutsetninger > Mislykkes i å estimere sjeldne forekomster

Lider av irrelevante funksjoner

Neural Networks

Bildegjenkjenning

Språkgjenkjenning og oversettelse

Taleegenkjenning

Visjongjenkjenning

Kan omtrentligse en ikke-lineær funksjon

Robust til utelukker

Fungerer bare med en del av eksemplene (støttestrukturen s)

Svært vanskelig å sette opp Vanskelig å stille på grunn av for mange parametere, og du må også bestemme nettverksarkitekturen

Vanskelig å tolke

Lett å overfit

Logistisk regresjon < Bestilling av resultater etter sannsynlighet

Modellering av markedsresponser

Enkel å forstå og forklare

Det overgår sjelden

Bruk av L1 og L2-regulering er effektiv i funksjonsvalg

Den beste algoritmen for å forutsi sannsynligheten for en Hendelse

Rask å trene

Lett å trene på store data takket være den stokastiske versjonen

Du må jobbe hardt for å gjøre den ukjent for funksjonshemmede. Kan lider av avvikere

SVD

Anbefaler Systemer

Kan omstrukturere data på en meningsfull måte

Vanskelig å forstå hvorfor dataene har blitt omstrukturert på en bestemt måte

PCA

Fjerne kollinearitet

Redusere dimensjonene til datasettet

Kan redusere datadimensjonalitet

Antyder sterke lineære antagelser (komponentene er en vektet summasjon av funksjoner) K-means

Segmentering Raskt i å finne klynger Kan detektere utjevninger i flere dimensjoner Lider av multikollinearitet
Klynger er sfæriske, kan ikke oppdage grupper av annen form Ustabil løsninger, avhenger av initialisering

Velge riktig algoritme for maskinlæring

Redaktørens valg

DSLR-filmskaping enheter som holder kameraet stødig - dummier

DSLR-filmskaping enheter som holder kameraet stødig - dummier

Du kan holde DSLR-kameraet mens du tar en film . Ikke i det "ta tak i kameraet nær ansiktet ditt som om du tok et øyeblikksbilde" -teknikk, men heller med tilbehør som gir hjelp til å holde kameraet stabilt. Kamera rigg systemer Tenk på det som et menneskelig stativ, en to-pod, hvis du vil, ved hjelp av din ...

DSLR Filmmaking: Slik kontrollerer du blenderåpning for effekt - dummier

DSLR Filmmaking: Slik kontrollerer du blenderåpning for effekt - dummier

Blenderåpningen gir bare en valgt mengde av lys inn i DSLR-objektivet. Dette er nyttig når du tar film. Tenk på det som en dørvakt på en eksklusiv nattklubb. Når du dikterer blenderåpning, styrer du fokusnivået i scenen, akkurat som fyren bak fløyeltauet velger hvem som kommer inn.

DSLR Filmmaking Fundamentals - dummies

DSLR Filmmaking Fundamentals - dummies

Den ekstra tiden du tar med DSLR under hver del av filmmakingsprosessen er ofte nøkkelbestanddelen til en vellykket film. Det betyr at du tar et par ekstra øyeblikk for å sikre at skuddet er teknisk perfekt. Mens du tar bilder, må du være oppmerksom på effektive variasjoner av hvert skudd i scenen. På ...

Redaktørens valg

Data Visualisering Storyboard: Dokumentasjon Key Performance Indicators (KPIs) - dummies

Data Visualisering Storyboard: Dokumentasjon Key Performance Indicators (KPIs) - dummies

Forstå nøkkelmålinger som publikum må vise, overvåke eller spore er det siste skrittet i utviklingen av historien din. Enkelt sagt er en nøkkelindikator (KPI) en kjerne-måling som knytter seg direkte til selskapets mål. Gjennomføre scoping-workshops Den beste måten å jobbe med publikum på for å dokumentere KPI-er er ...

Data Visualisering Storyboard: Dokumentasjonsmål - dummies

Data Visualisering Storyboard: Dokumentasjonsmål - dummies

Å Få en klar forståelse av målgruppens mål og eksisterende smertepunkter vil hjelpe du bestemmer hva du skal inkludere og - enda viktigere - hva som ikke skal inkluderes i storyboardet. Den enkleste måten å gjøre dette på, kan være å holde en liten planleggingsøkt som inkluderer executive sponsor (hvis det er en) og ...

Data Visualisering Storyboard: Identifisere målgruppen din - dummies

Data Visualisering Storyboard: Identifisere målgruppen din - dummies

Det første trinnet i å utvikle et klart storyboard for deg datavisualisering identifiserer publikum. Hvem du bygger data visualisering for å bestemme hvilken type storyboard du utvikler og hvilket nivå av data du viser. Den enkleste måten å klassifisere målgruppen din er å se på to enkle komponenter: forretningsområde ...

Redaktørens valg

Hvordan du dømmer tidskravene til markedsautomatisering - dummies

Hvordan du dømmer tidskravene til markedsautomatisering - dummies

Du bør ikke forvente å sette mer enn noen få timer i uken til å administrere en markedsføringsautomatiseringsapplikasjon etter at den er oppe. Den store investeringen av tid er alt på forsiden. I tillegg til å estimere tiden det tar å sette opp kampanjene dine, bør du også anslå tid for utdanning, ...

Slik implementerer du Sales Qualified Lead Reports - dummies

Slik implementerer du Sales Qualified Lead Reports - dummies

I markedsautomatisering, Sales Qualified Leads (SQLs) er markedsføring Kvalifiserte Leads (MQL) som salgsteamet aksepterer. Etter at en MQL blir en SQL, er den utelatt av markedsføringslaget, og all rapportering er basert på salgsmulighetstrinnet til det er lukket. Arbeid med salgsteamet ditt for å lage en SQL-arbeidsflyt. ...

Slik setter du inn egendefinerte felt i Marketing Automation Tools - dummies

Slik setter du inn egendefinerte felt i Marketing Automation Tools - dummies

Du har sannsynligvis allerede og bruker spesifikke data poeng for segmentering, kvalifikasjon eller hovedoppgave blant alle dine markedsføringsprogrammer. Det nye markedsføringsautomatiseringsverktøyet kommer med en grunnleggende database, som må utvides for å inkludere disse egendefinerte datapunkter. Dette betyr at du legger til egendefinerte felt ved å bruke de kommende trinnene. Egendefinerte felt er ...