Hjem Personlig finansiering Grensene for klassifiseringsdata i maskinlæring - dummier <[SET:descriptionno]Graderingsdata har begrensninger i maskinlæring.

Grensene for klassifiseringsdata i maskinlæring - dummier <[SET:descriptionno]Graderingsdata har begrensninger i maskinlæring.

Video: 17. Vurdering i Open edX: Grenser for godkjenning av arbeidskrav 2025

Video: 17. Vurdering i Open edX: Grenser for godkjenning av arbeidskrav 2025
Anonim

Klassifiseringsdata har begrensninger i maskinlæring. For anbefalingssystemer fungerer det bra, de trenger å vite om deg og andre, både som deg og forskjellig fra deg. Ved å oppnå karakterdata kan et anbefalingssystem lære av erfaringene fra flere kunder. Vurderingsdata kan hende fra en vurdering (for eksempel å rangere et produkt ved hjelp av stjerner eller tall) eller et faktum (en binær 1/0 som bare sier at du kjøpte produktet, så en film, eller sluttet å surfe på en bestemt nettside).

Uansett datakilde eller type, er vurderingsdata alltid om atferd. Hvis du vil vurdere en film, må du bestemme deg for å se den, se den, og rangere den ut fra din erfaring med å se filmen. Faktiske anbefalingssystemer lærer av vurderingsdata på forskjellige måter:

  • Samarbeidsfiltrering: Kamper Raters basert på film eller produkt likheter brukt tidligere. Du kan få anbefalinger basert på elementer likte folk som ligner på deg eller på ting som ligner på de du liker.
  • Innholdsbasert filtrering: Går utover det faktum at du så på en film. Den undersøker funksjonene i forhold til deg og filmen for å avgjøre om det eksisterer en kamp basert på de større kategoriene som funksjonene representerer. For eksempel, hvis du er en kvinne som liker actionfilmer, vil anbefaleren se etter forslag som inkluderer skjæringspunktet mellom disse to kategoriene.
  • Kunnskapsbaserte anbefalinger: Basert på metadata, for eksempel preferanser uttrykt av brukere og produktbeskrivelser. Den er avhengig av maskinlæring og er effektiv når du ikke har nok atferdsdata for å bestemme bruker- eller produktegenskaper. Dette kalles en kaldstart og representerer en av de vanskeligste anbefalingsoppgaver, fordi du ikke har tilgang til samarbeidsfiltrering eller innholdsbasert filtrering.

Når du bruker samarbeidsfiltrering, må du beregne likhet. Bortsett fra euklidiske, Manhattan og Chebyshev avstander, diskuterer resten av denne informasjonen cosinus likhet. Cosinell likhet måler vinkelkosinavstanden mellom to vektorer, som kan virke som et vanskelig konsept å forstå, men er bare en måte å måle vinkler i datavel på.

Forestill deg et mellomrom av funksjoner og ha to poeng. Du kan måle avstanden mellom punktene. For eksempel kan du bruke den euklidiske avstanden, som er et perfekt valg når du har få dimensjoner, men som mislykkes dårlig når du har flere dimensjoner på grunn av forbannelsen til dimensjonalitet.

Ideen bak cosinusavstanden er å bruke vinkelen som er opprettet av de to punktene som er knyttet til mellomromets opprinnelse (punktet der alle dimensjoner er null) i stedet. Hvis punktene er nær, er vinkelen smal, uansett hvor mange dimensjoner det er. Hvis de er langt borte, er vinkelen ganske stor.

Kosinisk likhet utfører cosinusavstanden i prosent og er ganske effektiv for å fortelle om en bruker ligner på en annen eller om en film kan knyttes til en annen fordi de samme brukerne favoriserer det. Følgende eksempel lokaliserer filmene som er de mest liknende filmene til film 50, Star Wars.

print (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- likhet (MovieLense [50],

MovieLense [-50]

metode = "cosine",

hvilke = "elementer")

colnames (similar_movies) [som (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "Empire Strikes Back, The (1980)"

[3] "Raiders of the Lost Ark (1981)"

"Retur av Jedi (1983)"

Grensene for klassifiseringsdata i maskinlæring - dummier <[SET:descriptionno]Graderingsdata har begrensninger i maskinlæring.

Redaktørens valg

Vis resultatene i forhold til et målområde i Excel-oversiktspanelet - dummies

Vis resultatene i forhold til et målområde i Excel-oversiktspanelet - dummies

Noen ganger trenger du målserier i Excel-oversikten og rapportene dine. I enkelte bedrifter er et mål ikke en verdi - det er en rekke verdier. Det vil si at målet er å holde seg innenfor et definert målområde. Tenk deg at du klarer en liten bedrift som selger esker med kjøtt. En del av jobben din er å ...

Slicer Tilpasninger for Slicers på Excel Dashboard - dummies

Slicer Tilpasninger for Slicers på Excel Dashboard - dummies

Hvis du skal bruke slicers på en Excel-dashbordet, bør du gjøre litt formatering for å få dine skiver til å passe til temaet og oppsettet på instrumentpanelet. Følgende diskusjon dekker noen formateringsjusteringer du kan gjøre til dine skiver. Størrelse og plassering av skiver En skiver oppfører seg som en standard Excel ...

Enkel statistikk i Excel Data Analyse - dummies

Enkel statistikk i Excel Data Analyse - dummies

Excel gir flere praktiske, brukervennlige verktøy for å analysere informasjon som du lagrer i et bord, inkludert noen raske og skitne statistiske verktøy. Se på følgende enkle bord. En enkel dagligvareliste. Et av de smaleste og raskeste verktøyene som Excel gir, er muligheten til enkelt å beregne summen, gjennomsnittet, antall, minimum og maksimum av ...

Redaktørens valg

Bruk fanen Filtre til å modifisere QuickBooks 2014 Rapporter - dummies

Bruk fanen Filtre til å modifisere QuickBooks 2014 Rapporter - dummies

Filtrene kategorien er trolig den mest interessante og en nyttig kategori som er levert av dialogboksen QuickBooks Modify Report. Filtre-fanen lar deg sette opp filtre som du kan bruke til å angi hvilken informasjon som oppsummeres i rapporten. For å bruke Filtrer-fanen velger du først feltet du vil ha ...

Bruk skjermfeltet til å modifisere QuickBooks 2012-rapporter - dummies

Bruk skjermfeltet til å modifisere QuickBooks 2012-rapporter - dummies

Hvis du klikker Tilpass rapport- QuickBooks viser dialogboksen Endre rapport, som du kan bruke til å tilpasse en rapport. Når du tilpasser en rapport, endrer du rapportens utseende, layout og informasjonen som den oppsummerer. Dialogboksen Endre rapport ser annerledes ut for ulike rapporttyper. Likevel, hvis du ser forbi ...

Slik bruker du QuickBooks for din hvite papir forretningsplan - dummies

Slik bruker du QuickBooks for din hvite papir forretningsplan - dummies

QuickBooks kan hjelpe deg skriv en hvit-papir forretningsplan. Folk skriver ofte en forretningsplan for hvitt papir når de vet at de trenger en strategisk plan, men ikke ønsker å ta de harde beslutningene som er nødvendige for en strategisk plan. Personen i denne konfronten skriver en lang hvit-papir forretningsplan for å camouflere den fraværende strategiske planen. ...

Redaktørens valg

Canon 60D elektronisk nivåfunksjon - dummies

Canon 60D elektronisk nivåfunksjon - dummies

Ikke hvert fotografi må være nivå med horisonten. Imidlertid lider mange typer bilder (landskap, bybilder og arkitektonisk fotografi) sterkt når kameraet er vippet. Den gammeldags løsningen for å utjevne kameraet ditt er å bruke et boble- eller åndnivå (funnet i fotobutikker) for å kontrollere kameraets justering med ...

Kamerainnstillingsdisplayet på et Canon EOS Rebel T3-serie Kamera-dummies

Kamerainnstillingsdisplayet på et Canon EOS Rebel T3-serie Kamera-dummies

På din Canon Rebel T3 eller T3i, kan du se en samling av tilleggsinnstillingsdata via kamerainnstillingsdisplayet. Denne skjermen er bare et informasjonsverktøy, men; Du kan ikke justere noen av de rapporterte innstillingene fra denne skjermen. For å vise skjermbildet Kamerainnstillinger på T3i, vis først innstillingsinnstillingene ...

Canon EOS 70D Kameraoppsett - dummies

Canon EOS 70D Kameraoppsett - dummies

Her er en oversikt over knappene, ringer og andre eksterne kontroller på Canon EOS 70D-kameraet ditt. Objektivet vist i de følgende figurene er Canon EF-S 18-135mm IS (bildestabiliseringsmodell) som selges med kameraet; Andre linser kan variere.