Hjem Personlig finansiering Grensene for klassifiseringsdata i maskinlæring - dummier <[SET:descriptionno]Graderingsdata har begrensninger i maskinlæring.

Grensene for klassifiseringsdata i maskinlæring - dummier <[SET:descriptionno]Graderingsdata har begrensninger i maskinlæring.

Video: 17. Vurdering i Open edX: Grenser for godkjenning av arbeidskrav 2024

Video: 17. Vurdering i Open edX: Grenser for godkjenning av arbeidskrav 2024
Anonim

Klassifiseringsdata har begrensninger i maskinlæring. For anbefalingssystemer fungerer det bra, de trenger å vite om deg og andre, både som deg og forskjellig fra deg. Ved å oppnå karakterdata kan et anbefalingssystem lære av erfaringene fra flere kunder. Vurderingsdata kan hende fra en vurdering (for eksempel å rangere et produkt ved hjelp av stjerner eller tall) eller et faktum (en binær 1/0 som bare sier at du kjøpte produktet, så en film, eller sluttet å surfe på en bestemt nettside).

Uansett datakilde eller type, er vurderingsdata alltid om atferd. Hvis du vil vurdere en film, må du bestemme deg for å se den, se den, og rangere den ut fra din erfaring med å se filmen. Faktiske anbefalingssystemer lærer av vurderingsdata på forskjellige måter:

  • Samarbeidsfiltrering: Kamper Raters basert på film eller produkt likheter brukt tidligere. Du kan få anbefalinger basert på elementer likte folk som ligner på deg eller på ting som ligner på de du liker.
  • Innholdsbasert filtrering: Går utover det faktum at du så på en film. Den undersøker funksjonene i forhold til deg og filmen for å avgjøre om det eksisterer en kamp basert på de større kategoriene som funksjonene representerer. For eksempel, hvis du er en kvinne som liker actionfilmer, vil anbefaleren se etter forslag som inkluderer skjæringspunktet mellom disse to kategoriene.
  • Kunnskapsbaserte anbefalinger: Basert på metadata, for eksempel preferanser uttrykt av brukere og produktbeskrivelser. Den er avhengig av maskinlæring og er effektiv når du ikke har nok atferdsdata for å bestemme bruker- eller produktegenskaper. Dette kalles en kaldstart og representerer en av de vanskeligste anbefalingsoppgaver, fordi du ikke har tilgang til samarbeidsfiltrering eller innholdsbasert filtrering.

Når du bruker samarbeidsfiltrering, må du beregne likhet. Bortsett fra euklidiske, Manhattan og Chebyshev avstander, diskuterer resten av denne informasjonen cosinus likhet. Cosinell likhet måler vinkelkosinavstanden mellom to vektorer, som kan virke som et vanskelig konsept å forstå, men er bare en måte å måle vinkler i datavel på.

Forestill deg et mellomrom av funksjoner og ha to poeng. Du kan måle avstanden mellom punktene. For eksempel kan du bruke den euklidiske avstanden, som er et perfekt valg når du har få dimensjoner, men som mislykkes dårlig når du har flere dimensjoner på grunn av forbannelsen til dimensjonalitet.

Ideen bak cosinusavstanden er å bruke vinkelen som er opprettet av de to punktene som er knyttet til mellomromets opprinnelse (punktet der alle dimensjoner er null) i stedet. Hvis punktene er nær, er vinkelen smal, uansett hvor mange dimensjoner det er. Hvis de er langt borte, er vinkelen ganske stor.

Kosinisk likhet utfører cosinusavstanden i prosent og er ganske effektiv for å fortelle om en bruker ligner på en annen eller om en film kan knyttes til en annen fordi de samme brukerne favoriserer det. Følgende eksempel lokaliserer filmene som er de mest liknende filmene til film 50, Star Wars.

print (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- likhet (MovieLense [50],

MovieLense [-50]

metode = "cosine",

hvilke = "elementer")

colnames (similar_movies) [som (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "Empire Strikes Back, The (1980)"

[3] "Raiders of the Lost Ark (1981)"

"Retur av Jedi (1983)"

Grensene for klassifiseringsdata i maskinlæring - dummier <[SET:descriptionno]Graderingsdata har begrensninger i maskinlæring.

Redaktørens valg

Vanlige visuelle studio-tastaturgenveier - dummier

Vanlige visuelle studio-tastaturgenveier - dummier

Du kan få tilgang til mange av funksjonene du bruker i Visual Studio til Lag en Silverlight-applikasjon gjennom tastaturgenveier. Her er de vanlige snarveiene som hjelper deg med å utføre oppgaver raskt i Visual Studio. Tastatur snarvei Handling Ctrl + Alt + F1 Åpne Visual Studio Documentation Ctrl + Shift + B Bygg programmet Ctrl + F5 Kjør prosjektet Ctrl + Alt + X Åpne verktøykassen hvis ...

Velg riktig format for e-postmarkedsføringsmeldingen din - dummies

Velg riktig format for e-postmarkedsføringsmeldingen din - dummies

Som Du komponerer markedsførings-e-postene dine, husk at formatet på e-posten din visuelt kommuniserer hovedideen til innholdet før publikum selv begynner å lese det. Forbrukerne forventer at formatet på e-posten din samsvarer med informasjonen den inneholder, slik at bruk av riktig format bidrar til å bygge publikums tillit. Velg ...

Kombinere flere samtaler til handling i din markedsføring e-post - dummies

Kombinere flere samtaler til handling i din markedsføring e-post - dummies

Din e-postmarkedsføringslisten består sannsynligvis av prospekter og kunder i ulike stadier av kjøpesyklusen med litt forskjellige interesser, så en del av publikum vil aldri være klar til å reagere umiddelbart på hver handling. Selv om alle på din e-postliste er klare til handling, er dine anrop til handling ...

Redaktørens valg

Opprett en Pivot-tabell YTD-totalvisning for Excel-rapporten - dummies

Opprett en Pivot-tabell YTD-totalvisning for Excel-rapporten - dummies

En nyttig rapportvisning I et Excel-pivottabell er YTD-totalsvisningen. Noen ganger er det nyttig å fange et løp-total-visning for å analysere bevegelsen av tall på en årlig basis (YTD) basis. Denne figuren illustrerer et pivottabell som viser en løpende total omsetning per måned for hvert år. I denne visningen er du ...

Opprett en pivottabel ved hjelp av Excels interne datamodell - dummies

Opprett en pivottabel ved hjelp av Excels interne datamodell - dummies

I enkelte tilfeller vil du kanskje opprett et pivottabell fra grunnen ved hjelp av Excels eksisterende interne datamodell som kildedata. Her er trinnene for å gjøre det: Velg Sett inn → PivotTable fra båndet. Dialogboksen Create PivotTable åpnes. Velg alternativet Bruk en ekstern datakilde, som vist, og klikk deretter på ...

Hvordan lage en standard snikker i Power Pivot - dummies

Hvordan lage en standard snikker i Power Pivot - dummies

Slicers tilbyr et brukervennlig grensesnitt med som du kan filtrere en Power Pivot pivottabell. Det er på tide å lage din første slicer. Bare følg disse trinnene:

Redaktørens valg

Alarmhendelsen i GameMaker: Studio-dummies

Alarmhendelsen i GameMaker: Studio-dummies

Alarmer er utmerket for når du vil ha tid Handlinger i din spill i GameMaker: Studio. For eksempel, hvis du vil at spilleren bare skal skyte kuler en gang hvert annet sekund, kan du sette en alarm for det. Hvis du vil når nye fiendtlige fly vises, kan du sette en alarm for det ...

Flytt retningsaktive handlinger i GameMaker: Studio - dummies

Flytt retningsaktive handlinger i GameMaker: Studio - dummies

I GameMaker: Studio, Flytt-fanen er den første kategorien i vinduet Objektegenskaper. Her er en liste over hver av handlingene du kan tilordne objektene. I følgende definisjoner brukes begrepet Instance for å referere til hva handlingen påvirker. Men du konfigurerer handlingen i objektet ...

Andre hendelser i GameMaker: Studio - dummies

Andre hendelser i GameMaker: Studio - dummies

I GameMaker: Studio, Andre hendelser er de som ikke anses verdige av sitt eget sted på menyen Event. Disse andre hendelsene kan være ganske kjempebra. Menyelementene er ganske mye selvforklarende, så det er ikke nødvendig med detaljer her. For fullstendige beskrivelser av hver av disse elementene, kan du alltid trykke F1 i GameMaker og ...