Video: Hvordan dele internett med mobilen din - Android 2024
Når du har data i høyformat i R, kan du enkelt bruke gittergrafikk til å visualisere undergrupper i dataene dine. For eksempel, hva skjer når du vil analysere mer enn én variabel samtidig?
Vurder det innebygde datasettet longley, som inneholder data om sysselsetting, arbeidsledighet og andre populasjonsindikatorer: >> str (longley) 'data. ramme ': 16 obs. av 7 variabler: $ BNP. deflator: num 83 88. 5 88. 2 89. 5 96. 2 … $ BNP: num 234 259 258 285 329 … $ Arbeidsledig: num 236 232 368 335 210 … $ Armed. Forces: num 159 146 162 165 310 … $ Befolkning: num 108 109 110 111 112 … $ År: int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 … $ Ansatt: num 60. 3 61. 1 60. 2 61. 2 63. 2 …
En måte å enkelt analysere de forskjellige variablene i en dataramme på er å først omforme datarammen fra bredt format til høyt format.
En enkel måte å omforme en dataramme fra bredt format til høyt format er å bruke funksjonen smelte () i reshape2-pakken.
Husk: reshape2 er ikke en del av basen R - det er en tilleggspakke som er tilgjengelig på CRAN. Du kan installere den med installasjonen. pakker ("reshape2") funksjon.
De ytterligere argumenter par. strimmel. tekst og skalaer styrer skriftstørrelsen (karakterutvidelsesforholdet) på strimlen øverst i diagrammet, samt skalaen.
Når du oppretter plott med flere grupper, må du kontrollere at den resulterende plottet er meningsfull. For eksempel er enheten av BNP (kort for
Bruttonasjonalprodukt
) trolig milliarder av dollar. I motsetning er befolkningsenheten trolig millioner av mennesker. (Dokumentasjonen av longley datasettet er ikke klart på dette emnet.)Vær svært forsiktig når du presenterer tomter som dette - du vil ikke bli anklaget for å opprette grafisk søppel (misvisende grafikk).