Innholdsfortegnelse:
- Beregning av området
- Området gir deg fortsatt begrenset informasjon. Ofte rapporterer statistikere den første og den tredje
- Standardverdien for prob-argumentet er en vektor som representerer minimumet (0), den første kvartilen (0. 25), medianen (0. 5), den tredje kvartil (0,75) og maksimum (1).
Video: Slik kontrollerer du om bærekulen er slitt | AUTODOC 2024
I tillegg til middel og variasjon kan du også se på kvantene i R. A quantile, eller percentil, forteller deg hvor mye av dataene dine ligger under en viss verdi. Den 50 prosentkvantilen, for eksempel, er den samme som medianen. Igjen, R har noen praktiske funksjoner for å hjelpe deg med å se på kvantiene.
Beregning av området
De mest brukte kvantiliene er faktisk 0 prosent og 100 prosent kvantiler. Du kan like lett ringe dem minimum og maksimum, fordi det er hva de er. Du kan få begge sammen ved hjelp av rekkevidde () -funksjonen. Denne funksjonen gir deg praktisk rekkevidde av dataene. Så, for å vite rekkevidde av kjørelengde, gjør du bare:
Beregning av kvartilene
Området gir deg fortsatt begrenset informasjon. Ofte rapporterer statistikere den første og den tredje
kvartilen sammen med intervallet og medianen. Disse kvartilene er henholdsvis 25 prosent og 75 prosent kvantiler, som er tallene for hvilke en fjerdedel og tre fjerdedeler av dataene er mindre. Du får disse tallene ved hjelp av quantile () -funksjonen, slik:
Komme på hastighet med kvantilfunksjonen
Quantile () -funksjonen kan gi deg noe kvantil du vil ha. For det bruker du probs-argumentet. Du gir probene (eller sannsynlighetene) som et brøknummer. For 20 prosentkvantilen bruker du for eksempel 0. 20 som et argument for verdien. Dette argumentet tar også en vektor som en verdi, slik at du for eksempel kan få 5 prosent og 95 prosentkvantiler som denne: >> quantile (biler $ mpg, probs = c (0, 05, 0.95)) 5% 95% 11. 995 31. 300Standardverdien for prob-argumentet er en vektor som representerer minimumet (0), den første kvartilen (0. 25), medianen (0. 5), den tredje kvartil (0,75) og maksimum (1).
Argumentet na. rm lar deg fjerne alle NA-verdier før du beregner den respektive statistikken. Hvis du ikke gjør dette, vil enhver vektor som inneholder NA ha NA som et resultat. Dette fungerer identisk med na. rm argument av summen () -funksjonen.