3 Typer maskinlæring - dummier - Personlig finansiering 2025

Video: Why The YouTube Algorithm Will Always Be A Mystery 2025

< Maskinlæring kommer i mange forskjellige smaker, avhengig av algoritmen og dens mål. Du kan dele maskininlæringsalgoritmer i tre hovedgrupper basert på deres formål:

Overvåket læring

Uopplærd læring
Forsterkning læring
Overvåket læring

Overvåket læring

oppstår når en algoritme lærer fra eksempel data og tilhørende målresponser som kan bestå av numeriske verdier eller strengetiketter, for eksempel klasser eller koder, for senere å forutsi den riktige responsen når de er laget med nye eksempler. Overvåket tilnærming er faktisk lik menneskelig læring under oppsyn av en lærer. Læreren gir gode eksempler for at studenten skal huske, og studenten får da generelle regler fra disse spesifikke eksemplene.

Du må skille mellom regresjonsproblemer, hvis mål er en numerisk verdi og klassifikasjonsproblemer, hvis mål er en kvalitativ variabel, for eksempel en klasse eller en tag. En regresjonsoppgave bestemmer gjennomsnittsprisene på boliger i Boston-området, og en klassifikasjonsoppgave skiller mellom typer irisblomster basert på deres sepal og petal-tiltak.

Unservervised learning

oppstår når en algoritme lærer fra enkle eksempler uten noen tilknyttet respons, og etterlater til algoritmen for å bestemme datamønstrene alene. Denne typen algoritme har en tendens til å omstrukturere dataene til noe annet, for eksempel nye funksjoner som kan representere en klasse eller en ny serie ukorrelerte verdier. De er ganske nyttige i å gi mennesker innblikk i betydningen av data og nye nyttige innganger til overvåkede maskinlæringsalgoritmer.

Som en slags læring, ligner den hvordan mennesker bruker for å finne ut at visse objekter eller hendelser er fra samme klasse, for eksempel ved å observere graden av likhet mellom objekter. Noen anbefalingssystemer som du finner på nettet i form av markedsautomatisering, er basert på denne typen læring.

Markedsautomatiseringsalgoritmen kommer frem av forslag fra hva du har kjøpt tidligere. Anbefalingene er basert på en estimering av hvilken gruppe kunder du ligner mest, og deretter avgir dine sannsynlige preferanser basert på den gruppen.

Forsterkning læring

oppstår når du presenterer algoritmen med eksempler som mangler etiketter, som i ikke-overvåket læring. Du kan imidlertid følge et eksempel med positiv eller negativ tilbakemelding i henhold til løsningen som algoritmen foreslår.Forsterkning læring er knyttet til applikasjoner som algoritmen må ta avgjørelser for (slik at produktet er prescriptivt, ikke bare beskrivende, som i ikke-overvåket læring), og beslutningene har konsekvenser. I den menneskelige verden er det akkurat som å lære ved prøving og feiling. Feil hjelper deg med å lære fordi de har lagt til en straff (kostnad, tap av tid, angre, smerte osv.), Og lærer deg at et bestemt handlingsopplegg er mindre sannsynlig å lykkes enn andre. Et interessant eksempel på forsterkningsinlæring skjer når datamaskiner lærer å spille videospill av seg selv.

I dette tilfellet presenterer en applikasjon algoritmen med eksempler på spesifikke situasjoner, for eksempel å ha spilleren sittende fast i en labyrint mens du unngår en fiende. Programmet lar algoritmen vite utfallet av handlinger det tar, og læring oppstår mens du prøver å unngå det som oppdages for å være farlig og for å forfølge overlevelse. Du kan se på hvordan selskapet Google DeepMind har skapt et forsterknings læringsprogram som spiller gamle Atarias videospill. Når du ser på videoen, legg merke til hvordan programmet er i utgangspunktet klumpete og ufaglært, men stadig forbedrer med trening til det blir en mester.