Video: The American Revolution - OverSimplified (Part 1) 2024
Du har datasettet og du har formatert det slik at det passer dine behov i R, så nå er du klar for det virkelige arbeidet. Analysere dataene dine starter alltid med å beskrive den. På denne måten kan du oppdage feil i dataene, og du kan bestemme hvilke modeller som passer for å få den informasjonen du trenger fra dataene du har.
Hvilken beskrivende statistikk du bruker avhenger av naturen av dataene dine selvfølgelig.
Noen ganger er du mer interessert i det generelle bildet av dataene dine enn du er i de enkelte verdiene. Du kan være interessert ikke i kjørelengde for hver bil, men i gjennomsnittlig kjørelengde av alle biler fra datasettet. For dette beregner du middelverdien ved hjelp av mean () -funksjonen, slik: >> mean (cars $ mpg) [1] 20. 09062
Du kan også beregne gjennomsnittlig antall sylindre de har, men dette er ikke veldig fornuftig. Gjennomsnittet ville være 6. 1875 sylindere, og ingen biler kjører med en ufullstendig sylinder. I dette tilfellet er
median - den mest sentrale verdien i dataene dine - mer fornuftig. Du får medianen fra å bruke funksjonen median (), slik: