Innholdsfortegnelse:
Video: Slik lager du Softis i snøen 2024
For å utforske gittergrafikk i R, må du først se på de innebygde datasettmtcars. Dette datasettet inneholder 32 observasjoner av biler og informasjon om motoren, som antall sylindere, automatisk versus manuell girkasse og motorkraft.
Alle de innebygde datasettene til R har også god hjelpsinformasjon som du kan få tilgang til via hjelpemekanismen - for eksempel ved å skrive? mtcars inn i R konsollen.
Si at du vil utforske forholdet mellom drivstofføkonomi og motorkraft. Mtcars datasett har to elementer med denne informasjonen:
-
: Brenseløkonomi målt i miles per gallon (mpg) hk
-
: Motoreffekt målt i hestekrefter (hk) Selv om Gitterpakken er en del av R-distribusjonen, og du må fortelle R at du planlegger å bruke koden i denne pakken. Du gjør dette med biblioteket () -funksjonen. Husk at du må gjøre dette ved starten av hver ren R-sesjon der du vil bruke gitter:
Gitterpakken har en rekke forskjellige funksjoner for å lage forskjellige typer plott. For eksempel, for å lage en scatterplot, bruk xyplot () -funksjonen. Legg merke til at dette er forskjellig fra grunngrafikk, hvor plott () -funksjonen oppretter en rekke forskjellige plottetyper (på grunn av metodeforsendingsmekanismen).
For å lage en gitterplot, må du angi minst to argumenter:
formel
:-
Dette er en formel som er typisk for skjemaet y ~ x | z. Det betyr å lage en plot av y mot x, betinget av z. Med andre ord, opprett et plott for hver unike verdi av z. Hver av variablene i formelen må være en kolonne i datarammen som du angir i datarg argumentet. data :
-
En dataramme som inneholder alle kolonnene du spesifiserer i formelargumentet. Dette eksemplet skal gjøre det klart: >> xyplot (mpg ~ hp | faktor (cyl), data = mtcars) Du kan se at:
Variablene mpg, hp og cyl er kolonner i datarammen mtcars.
Selv om cyl er en numerisk vektor, kan antall sylindere i en bil bare være hele tall (eller
diskrete variabler,
-
i statistisk sjargong). Ved å bruke faktor (syl) i koden din, forteller du R at sylinder faktisk er en diskret variabel. Hvis du glemmer å gjøre dette, vil R fortsatt lage en grafikk, men etikettene på stripene øverst på hvert panel vil bli vist annerledes.
-
Fordi hver av bilene i datarammen har fire, seks eller åtte sylindere, har diagrammet tre rutene. Du kan se at bilene med større motorer har en tendens til å ha mer kraft (hk) og dårligere drivstofforbruk (mpg). Legg til trendlinjer Når du forteller gitteret å beregne en linje med best passform, gjør det det for hvert panel i plottet. Dette er grei å bruke xyplot (), fordi det er så enkelt som å legge til et type argument. Spesielt vil du spesifisere at typen er begge punkter (type = "p") og regresjon (type = "r"). Du kan kombinere ulike typer med funksjonen c (): >> xyplot (mpg ~ hp | faktor (syl), data = mtcars, + type = c ("p", "r")) >