Hjem Personlig finansiering Maskinlæring: Lag dine egne egenskaper i data - dummier

Maskinlæring: Lag dine egne egenskaper i data - dummier

Innholdsfortegnelse:

Video: Computational Linguistics, by Lucas Freitas 2024

Video: Computational Linguistics, by Lucas Freitas 2024
Anonim

Noen ganger vil de rå dataene du får fra ulike kilder, ikke ha de funksjonene som trengs for å utføre maskinopplæringsoppgaver. Når dette skjer, må du opprette dine egne funksjoner for å oppnå ønsket resultat. Å skape en funksjon betyr ikke at du lager data fra tynn luft. Du oppretter nye funksjoner fra eksisterende data.

Forstå behovet for å lage funksjoner

En stor begrensning av maskinlæringsalgoritmer er at det kan være umulig å gjette en formel som kan knytte ditt svar til funksjonene du bruker. Noen ganger kan denne manglende gjetning skje fordi du ikke kan kartlegge svaret ved å bruke informasjonen du har tilgjengelig (noe som betyr at du ikke har riktig informasjon). I andre tilfeller hjelper informasjonen du oppgav ikke algoritmen til å lære riktig.

For eksempel, hvis du modellerer prisen på eiendomsmegling, er overflaten av landet ganske forutsigbar fordi større eiendommer pleier å koste mer. Men hvis du gir i stedet for overflaten din maskininlæringsalgoritme med lengden på sidene av landet (breddegrad og lengdegradskoordinater av sine hjørner), kan algoritmen din ikke finne ut hva du skal gjøre med informasjonen du oppgav. Noen algoritmer klarer å finne forholdet mellom funksjonene, men de fleste algoritmer vil ikke.

Svaret på dette problemet er funksjonskompetanse. Funksjonsskaping er den delen av maskinlæring som regnes som mer en kunst enn en vitenskap, fordi det innebærer menneskelig inngrep ved kreativ blanding av eksisterende funksjoner. Du utfører denne oppgaven ved hjelp av tillegg, subtraksjon, multiplikasjon og forhold for å generere nye avledede funksjoner med mer prediktiv kraft enn originalene.

Å vite problemet godt og finne ut hvordan et menneske vil løse det, er en del av funksjonskapasiteten. Så, ved å koble til det forrige eksempelet, er det faktum at jordoverflaten knytter seg til eiendomsprisen felles kjennskap. Hvis overflaten mangler fra funksjonene dine når du prøver å gjette verdien av en eiendom, kan du gjenopprette slik informasjon fra eksisterende data - og dermed øker ytelsen til spådommene.

Uansett om du stole på sunn fornuft, felles kunnskap eller spesialisert kompetanse, kan du gjøre mye for maskinalgoritmen din hvis du først finner ut hvilken informasjon som skal fungere best for problemet og deretter prøv å få den tilgjengelig eller utlede den blant dine funksjoner.

Opprette funksjoner automatisk

Du kan opprette nye funksjoner automatisk.En måte å oppnå automatisk funksjonalisering på er å bruke polynomial ekspansjon. Spesifikke måter er tilgjengelige for å oppnå polynomial ekspansjon, slik at du oppretter funksjoner automatisk i både R og Python. For tiden må du forstå konseptene bak polynomial ekspansjon.

I polynomial ekspansjon oppretter du automatisk interaksjoner mellom funksjoner og krever krefter (for eksempel beregning av firkanten av en funksjon). Interaksjoner er avhengig av multiplisering av funksjonene. Å skape en ny funksjon ved hjelp av multiplikasjon bidrar til å holde oversikt over hvordan funksjoner har en tendens til å oppføre seg som en helhet. Derfor hjelper det å kartlegge komplekse forhold mellom funksjonene dine som kan hint i spesielle situasjoner.

Et godt eksempel på en interaksjon er lyden fra en bil og prisen på bilen. Forbrukerne setter ikke pris på støyende biler med mindre de kjøper en sportsbil, i hvilket tilfelle motorstøyen er et pluss som minner eieren av bilens kraft. Det gjør også tilhengerne oppmerksom på den kule bilen, så lyd spiller en stor rolle i å vise seg fordi støy vil sikkert tiltrekke seg andre oppmerksomhet. På den annen side, er støy når du kjører en familiebil, ikke så kul.

I en maskinlæringsapplikasjon, når du prøver å forutsi preferansepreferansen for en bestemt bil, er egenskaper som støy og prisen på bilen forutsigbare av seg selv. Men å multiplisere de to verdiene og legge dem til settet av funksjoner, kan utvilsomt hint på en læringsalgoritme at målet er en sportsbil (når du multipliserer høye støynivåer med høy pris).

Gir hjelp ved å skape ikke-lineære relasjoner mellom responsen og funksjonene, hinting i bestemte situasjoner.

Som et annet eksempel, tenk at du må forutsi en persons årlige utgifter. Alder er en god forutsigelse fordi etter hvert som folk blir gamle og modne, endres deres livs- og familiesituasjon også. Studentene starter ut fattige, men så finner du jobb og kan bygge en familie. Fra et generelt synspunkt har utgifter en tendens til å vokse som alder til et visst punkt. Pensjonering markerer vanligvis et punkt hvor utgifter har en tendens til å redusere. Alder inneholder slik informasjon, men det er en funksjon som har en tendens til å vokse, og relaterte utgifter til veksten bidrar ikke til å beskrive inversjonen som oppstår i en viss alder.

Når du legger til kvadratfunksjonen, kan du opprette en motvirkning for å alder selv, noe som er liten i begynnelsen, men vokser raskt med alderen. Den endelige effekten er en parabol, med en innledende vekst preget av en topp i utgifter i en viss alder, og deretter en nedgang.

Som nevnt i begynnelsen, kan du vite på forhånd at slik dynamikk (støy og sportsbil, forbruk og eldre alder) kan hjelpe deg med å skape de riktige funksjonene. Men hvis du ikke kjenner disse dynamikkene i forveien, vil polynomial ekspansjon automatisk lage dem for deg fordi, gitt en bestemt rekkefølge, vil det skape interaksjoner og krefter i den rekkefølgen. Ordren vil påpeke antall multiplikasjoner og maksimal effekt som skal gjelde for eksisterende funksjoner.

Så en polynomisk utvidelse av rekkefølge 2 hever alle funksjonene til den andre kraften og multipliserer hver enkelt funksjon av alle de andre. (Du får multiplikasjonen av alle kombinasjonene av to funksjoner.) Jo høyere tallet, desto flere nye funksjoner vil bli opprettet, men mange av dem vil være overflødige og bare bidra til å gjøre maskinens læringalgoritme overfit dataene.

Når du bruker polynomial ekspansjon, må du være oppmerksom på eksplosjonen av funksjoner du oppretter. Styrken øker lineært, så hvis du har fem funksjoner og du trenger en utvidelse av rekkefølge 2, økes hver funksjon opp til den andre strømmen. Øke rekkefølgen på en legger bare til en ny strømfunksjon for hver opprinnelig funksjon. I stedet øker samspillet basert på kombinasjoner av funksjonene opp til den rekkefølgen.

Faktisk, med fem funksjoner og en polynomial utvidelse av rekkefølge 2, opprettes alle ti unike kombinasjoner av koblingen av funksjonene. Øke rekkefølgen til 3 vil kreve opprettelsen av alle de unike kombinasjonene av to variabler, pluss de unike kombinasjonene av tre variabler, det vil si 20 funksjoner.

Maskinlæring: Lag dine egne egenskaper i data - dummier

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...