Innholdsfortegnelse:
- Slik sammenligner du to datasampler
- I de fleste tilfeller vil du ikke sammenligne to prøver med hverandre, men sammenligne et utvalg med en teoretisk prøve som kommer fra en bestemt distribusjon (for eksempel den normale fordeling).
Video: Slik bruker du kart og kompass 2024
Histogrammer gir mye til tolkningen av betrakteren. En bedre grafisk måte i R for å fortelle om dataene dine distribueres normalt, er å se på en såkalt quantile-quantile (QQ) plot.
Med denne teknikken, plotter du kvantiler mot hverandre. Hvis du sammenligner to prøver, for eksempel, sammenligner du bare kvantilene av begge prøvene. Eller, for å si det litt annerledes, gjør R følgende for å konstruere en QQ-plot:
-
Det sorterer dataene fra begge prøvene.
-
Det plotter disse sorterte verdiene mot hverandre.
Hvis begge eksemplene ikke inneholder det samme antall verdier, beregner R ekstraverdier ved interpolering for den minste prøven for å lage to prøver av samme størrelse.
Slik sammenligner du to datasampler
Selvfølgelig trenger du ikke å gjøre alt selv, du kan bare bruke funksjonen qqplot () for det. Så, for å sjekke om temperaturene under aktivitet og resten blir fordelt på samme måte, gjør du bare følgende:
Dette skaper et plott hvor de bestilte verdiene er tegnet mot hverandre.
Mellom firkantede parenteser kan du bruke en logisk vektor for å velge de tilfellene du vil ha. Her velger du alle tilfeller der variabelen aktiv er lik 1 for den første prøven, og alle tilfeller der variabelen er lik 0 for den andre prøven.
I de fleste tilfeller vil du ikke sammenligne to prøver med hverandre, men sammenligne et utvalg med en teoretisk prøve som kommer fra en bestemt distribusjon (for eksempel den normale fordeling).
For å lage en QQ-plott på denne måten har R den spesielle qqnorm () -funksjonen. Som navnet tilsier, plottar denne funksjonen prøven mot en normal fordeling. Du gir bare prøven du vil plotte som et første argument, og legge til noen grafiske parametre du liker.
R lager da en prøve med verdier som kommer fra
standard normalfordeling, eller en normalfordeling med et gjennomsnitt på null og en standardavvikelse på en. Med denne andre prøven oppretter R QQ-plottet som forklart før. R har også en qqline () -funksjon, som legger til en linje i din normale QQ-plott. Denne linjen gjør det mye lettere å vurdere om du ser en klar avvik fra normaliteten. Jo nærmere alle poeng ligger til linjen, jo nærmere fordelingen av prøven kommer til normalfordeling. Funksjonen qqline () tar også prøven som et argument.
Nå vil du gjøre dette for temperaturene i både aktiv og inaktiv periode av beveren. Du kan bruke funksjonen qqnorm () to ganger for å lage begge tomter. For de inaktive periodene kan du bruke følgende kode: >> qqnorm (beaver2 $ temp [beaver2 $ aktiv == 0], main = "Inaktiv")> qqline (beaver2 $ temp [beaver2 $ active == 0])
Du kan gjøre det samme for den aktive perioden ved å endre verdien 0 til 1.