Innholdsfortegnelse:
Video: Data Visualization and D3 by David Chouinard 2024
For å få en klarere visuell ide om hvordan dataene dine fordeles innenfor rekkevidden, kan du plotte et histogram ved hjelp av R. For å lage et histogram for kilometerdataene, bruker du bare hist () -funksjonen slik: >> hist (biler $ mpg, col = "grå")
Du ser at hist () -funksjonen først kutter rekkevidden av dataene i en rekke jevne mellomrom, og deretter teller antall observasjoner i hvert intervall. Stangens høyde er proporsjonal med disse frekvensene. På
y -axen finner du tellingene.
Slik spiller du med pauser
R velger antall intervaller som den anser mest nyttige for å representere dataene, men du kan være uenig med hva R gjør og velger å bryte seg selv. For dette bruker du bryterargumentet for hist () -funksjonen.
Du kan fortelle R antall barer du vil ha i histogrammet ved å gi et enkelt nummer som argumentet.
-
Bare vær oppmerksom på at R fortsatt vil avgjøre om det egentlig er rimelig, og det prøver å kutte opp rekkevidden ved hjelp av fine avrundede tall. Du kan fortelle R nøyaktig hvor du skal sette pausene ved å gi en vektor med breakpoengene som en verdi for argumentet
-
breaks .
Så hvis du ikke er enig med R og du vil ha barer som representerer intervaller 5 til 15, 15 til 25 og 25 til 35, kan du gjøre dette med følgende kode: >> hist (biler $ mpg, pauser = c (5, 15, 25, 35))
Du kan også gi navnet på algoritmen R som skal brukes til å bestemme antall pauser som verdien for bryter argumentet. Du kan finne mer informasjon om disse algoritmer på hjelpesiden? hist. Prøv å eksperimentere med disse algoritmer litt for å sjekke hvilken som fungerer best.