Innholdsfortegnelse:
Video: Why The YouTube Algorithm Will Always Be A Mystery 2025
Overvåket læring
- Uopplærd læring
- Forsterkning læring
- Overvåket læring
Overvåket læring
oppstår når en algoritme lærer fra eksempel data og tilhørende målresponser som kan bestå av numeriske verdier eller strengetiketter, for eksempel klasser eller koder, for senere å forutsi den riktige responsen når de er laget med nye eksempler. Overvåket tilnærming er faktisk lik menneskelig læring under oppsyn av en lærer. Læreren gir gode eksempler for at studenten skal huske, og studenten får da generelle regler fra disse spesifikke eksemplene.
Unservervised learning
oppstår når en algoritme lærer fra enkle eksempler uten noen tilknyttet respons, og etterlater til algoritmen for å bestemme datamønstrene alene. Denne typen algoritme har en tendens til å omstrukturere dataene til noe annet, for eksempel nye funksjoner som kan representere en klasse eller en ny serie ukorrelerte verdier. De er ganske nyttige i å gi mennesker innblikk i betydningen av data og nye nyttige innganger til overvåkede maskinlæringsalgoritmer.
Markedsautomatiseringsalgoritmen kommer frem av forslag fra hva du har kjøpt tidligere. Anbefalingene er basert på en estimering av hvilken gruppe kunder du ligner mest, og deretter avgir dine sannsynlige preferanser basert på den gruppen.
Forsterkning læring
Forsterkning læring
oppstår når du presenterer algoritmen med eksempler som mangler etiketter, som i ikke-overvåket læring. Du kan imidlertid følge et eksempel med positiv eller negativ tilbakemelding i henhold til løsningen som algoritmen foreslår.Forsterkning læring er knyttet til applikasjoner som algoritmen må ta avgjørelser for (slik at produktet er prescriptivt, ikke bare beskrivende, som i ikke-overvåket læring), og beslutningene har konsekvenser. I den menneskelige verden er det akkurat som å lære ved prøving og feiling. Feil hjelper deg med å lære fordi de har lagt til en straff (kostnad, tap av tid, angre, smerte osv.), Og lærer deg at et bestemt handlingsopplegg er mindre sannsynlig å lykkes enn andre. Et interessant eksempel på forsterkningsinlæring skjer når datamaskiner lærer å spille videospill av seg selv.
I dette tilfellet presenterer en applikasjon algoritmen med eksempler på spesifikke situasjoner, for eksempel å ha spilleren sittende fast i en labyrint mens du unngår en fiende. Programmet lar algoritmen vite utfallet av handlinger det tar, og læring oppstår mens du prøver å unngå det som oppdages for å være farlig og for å forfølge overlevelse. Du kan se på hvordan selskapet Google DeepMind har skapt et forsterknings læringsprogram som spiller gamle Atarias videospill. Når du ser på videoen, legg merke til hvordan programmet er i utgangspunktet klumpete og ufaglært, men stadig forbedrer med trening til det blir en mester.
