Hjem Personlig finansiering Hvordan du lager en prediktiv Analytics-modell med R-regresjon - dummies

Hvordan du lager en prediktiv Analytics-modell med R-regresjon - dummies

Video: Calling All Cars: Disappearing Scar / Cinder Dick / The Man Who Lost His Face 2024

Video: Calling All Cars: Disappearing Scar / Cinder Dick / The Man Who Lost His Face 2024
Anonim

Du vil opprette en prediktiv analysemodell som du kan evaluere ved å bruke kjente utfall. For å gjøre det, skal vi dele datasettet i to sett: en for trening av modellen og en for testing av modellen. En 70/30 deling mellom trening og testing av datasett vil være tilstrekkelig. De neste to kodelinjene beregner og lagrer størrelsene på hvert sett: >> trainSize testSize <- nrow (autos) - trainSize

For å skrive ut verdiene, skriv inn navnet på variabelen som brukes til å lagre verdien og trykk enter. Her er utdataene:

>> trainSize [1] 279> testSize [1] 119

Denne koden bestemmer størrelsen på datasettene du har til hensikt å lage trenings- og testdatasettene. Du har fortsatt ikke faktisk opprettet disse settene. Også, du vil ikke bare ringe de første 279 observasjonene treningssettet og ringe de siste 119 observasjonene testsettet. Det ville skape en dårlig modell fordi datasettet ser ut som bestilt. Spesifikt er modell Year-kolonnen bestilt fra minste til største.

Fra undersøkelsen av dataene kan du se at de fleste av de tyngre, åtte sylinder, større forskyvning, større hestekrefter er plassert øverst på datasettet. Fra denne observasjonen, uten å måtte kjøre noen algoritmer på dataene, kan du allerede fortelle (generelt for dette datasettet) eldre biler sammenlignet med nyere biler som følger:

Er tyngre

Har åtte sylindere

  • Har større forskyvning

  • Har større hestekrefter

    Ok, åpenbart mange mennesker vet noe om biler, så en gjetning om hva korrelasjonene er, vil ikke bli for langt etter at du har sett dataene. Noen med mye bilkunnskap kan allerede ha kjent dette uten å se på dataene.
  • Dette er bare et enkelt eksempel på et domene (biler) som mange mennesker kan forholde seg til. Hvis dette var data om kreft, ville de fleste ikke umiddelbart forstå hva hvert attributt betyr.

Her er en domeneekspert og en datamodeller avgjørende for modelleringsprosessen. Domeneeksperter kan ha den beste kjennskapen til hvilke attributter som er mest (eller minst) viktige - og hvordan attributter korrelerer med hverandre.

De kan foreslå til datamodellen hvilke variabler som skal eksperimentere med. De kan gi større vekter til flere viktige attributter og / eller mindre vekter til attributter av minst betydning (eller fjern dem helt).

Så du må lage et treningsdatasett og et testdatasett som er virkelig representativt for hele settet. En måte å gjøre det på er å opprette treningssettet fra et tilfeldig utvalg av hele datasettet.I tillegg vil du gjøre denne testen reproduserbar slik at du kan lære av det samme eksemplet.

Sett så frøet for tilfeldig generator, så vi vil ha det samme "tilfeldige" treningssettet. Følgende kode gjør denne oppgaven: >> sett. frø (123)> training_indices <- sample (seq_len (nrow (autos)), size = trainSize)> trainSet testSet <- autos [-training_indices,]

Treningssettet inneholder 279 observasjoner, sammen med resultatet (mpg) av hver observasjon. Regresjonsalgoritmen bruker utfallet til å trene modellen ved å se på forholdet mellom prediktorvariablene (noen av de sju attributter) og responsvariabelen (mpg).

Testsettet inneholder resten av dataene (det vil si den delen som ikke er inkludert i treningssettet). Du bør legge merke til at testsettet også inneholder respons (mpg) variabelen. 

Når du bruker prediksjonsfunksjonen (fra modellen) med testsettet, ignorerer du svarsvariabelen og bruker bare prediktorvariablene så lenge kolonnene er de samme som i treningssettet.

For å lage en lineær regresjonsmodell som bruker mpg-attributtet som svarvariabel og alle de andre variablene som prediktorvariabler, skriv inn følgende linje kode: >> modell

Hvordan du lager en prediktiv Analytics-modell med R-regresjon - dummies

Redaktørens valg

Hvordan å stable og gruppereformer i Word 2013 - dummies

Hvordan å stable og gruppereformer i Word 2013 - dummies

Enkeltformer kan noen ganger være nyttige i en dokument, men den virkelige kraften til Word 2013's Shapes-funksjonen kan bli funnet ved å kombinere figurer for å lage mer komplekse tegninger og logoer. Du kan stable formene oppå hverandre og kontrollere rekkefølgen de vises i stakken. Når du har ...

Hvordan du angir punktavstand i Word 2013 - dummies

Hvordan du angir punktavstand i Word 2013 - dummies

Word 2013 lar deg legge til "luft" til plass før eller etter eller i midten av avsnittene dine. I midten av avsnittet har du linjeavstand. Før og etter avsnittet kommer punktavstand. Hvordan sette linjeavstanden Endre linjeavstanden legger til ekstra mellomrom mellom alle tekstlinjer ...

Slik starter du et nytt dokument i Word 2007 - dummies

Slik starter du et nytt dokument i Word 2007 - dummies

Starter et nytt dokument i Word 2007 er lett. Hvis du nettopp har startet Word 2007 og vil åpne et tomt dokument, kan du følge tre enkle trinn.

Redaktørens valg

Slik oppretter du en AWS Administrator User - Dummies

Slik oppretter du en AWS Administrator User - Dummies

Opprett Administrator-gruppen er det første trinnet for å sikre at din AWS (Amazon Web Services) -kontoen er fortsatt trygg. Det neste trinnet er å opprette en konto for deg selv og tilordne den til administratorgruppen, slik at du har full tilgang til de administrative funksjonene i din AWS-konto. Følgende trinn beskriver hvordan ...

Vurderer AWS-støttede plattformer - dummies

Vurderer AWS-støttede plattformer - dummies

Hvis du ikke har behandlet AWS eller skyen ennå, du kan være fristet til å tenke på plattformer som en bestemt kombinasjon av gjenstander. For eksempel, når du ser ditt eget lokale oppsett, har du en server som kjører et bestemt operativsystem og har et bestemt sett med maskinvareressurser. Systemet har en bestemt ...

Lage skuffer på Amazon Web Services - dummies

Lage skuffer på Amazon Web Services - dummies

Når du er den stolte eieren av Amazon Web Services (AWS ) konto, det er på tide å gjøre noe nyttig, som å lage en bøtte. Start med å sjekke ut dine S3-ressurser. For å gjøre det, klikk S3-lenken på startsiden for AWS Management Console, som vist her: Du er tatt til en side som lar deg administrere ...

Redaktørens valg

Slik bruker du Eye-Fi med Evernote-dummies

Slik bruker du Eye-Fi med Evernote-dummies

Et selskap kalt Eye-Fi gjør det mulig å Koble kameraet ditt med Evernote, selv uten å koble kameraet til datamaskinen. Følg disse trinnene for å bruke Eye-Fi: Følg instruksjonene som følger med Eye-Fi-kortet for å konfigurere en Eye-Fi-konto. Sett inn Eye-Fi-kortet i kameraet. Slå på kameraet ditt. ...

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hvordan man merker på Evernote for datamaskiner og tabletter - dummies

Hele poenget med å lagre nyttig informasjon er for å kunne finne den senere. Tagging i Evernote er fundamentalt lik for alle plattformer og er ekstremt nyttig når du dash om å prøve å skrive inn notater på hvilken enhet du bruker på den tiden. For å lage en tagg for et notat på en datamaskin eller ...