Innholdsfortegnelse:
Video: HVORDAN DEFINERER DU TRANCE? - Steen Kofoed 2024
En ggplot2 geom i R forteller plottet hvordan du vil vise dataene dine. For eksempel bruker du geom_bar () for å lage et strekdiagram. I ggplot2 kan du bruke en rekke forhåndsdefinerte geomer for å lage standardtyper.
En geom definerer utformingen av et ggplot2-lag. For eksempel er det geomer å lage strekdiagrammer, scatterplots og linjediagrammer (samt en rekke andre tomter).
Hver geom har en standardstat, og hver stat har en standard geom. I praksis må du bare spesifisere en av disse.
Geom | Beskrivelse | Standardstat |
---|---|---|
geom_bar () | Strekdiagram | stat_bin () |
geom_point () | Scatterplot | stat_identity () |
geom_line () | Linjediagram, tilkobling av observasjoner i rekkefølge av
x -value |
stat_identity () |
geom_boxplot | Boks-og-whisker plot | stat_boxplot () |
geom_path | Linjediagram, forbinder observasjoner i opprinnelig rekkefølge | stat_identity () |
geom_smooth | Legg til en glatt standardisert gjennomsnittlig | stat_smooth () |
geom_histogram | En alias for geom_bar () og stat_bin () | stat_bin () |
Hvordan lage et strekdiagram ved hjelp av ggplot2 i R
For å lage et strekdiagram bruker du geom_bar () -funksjonen. Vær imidlertid oppmerksom på at standardstatistikken er stat_bin (), som brukes til å kutte dataene dine i skuffene. Dermed er standard oppførselen til geom_bar () for å lage et histogram.
For eksempel, for å lage et histogram av dybden av jordskjelv i jordskjelvdatasettet, gjør du følgende: >> ggplot (skjelv, aes (x = dybde)) + geom_bar ()> ggplot (quakes, aes (x = dybde)) + geom_bar (binwidth = 50)
Legg merke til at kartleggingen din bare definerer
x -aksjonsvariabelen (i dette tilfellet, quakes $ depth). Et nyttig argument til geom_bar () er binvidth, som styrer størrelsen på skuffene som dataene dine er kuttet inn i.
I det neste eksemplet bruker du aggregat () for å beregne antall skjelv på forskjellige dybdelag: >> skjelv. agg navn (quakes. agg) <- c ("dybde", "mag")
Nå kan du plotte objektet quakes. agg med geom_bar (stat = "identitet"): >> ggplot (quakes. agg, aes (x = dybde, y = mag)) + + geom_bar (stat = "identitet")
Sammendrag kan du bruk geom_bar () for å lage et histogram og la ggplot2 oppsummere dataene dine, eller du kan forhåndsoppsummere dataene dine og deretter bruke stat = "identitet" for å tegne et strekdiagram.
Hvordan lage en scatterplot i ggplot2
For å lage en scatterplot, bruker du geom_point () -funksjonen.En scatterplot lager poeng (eller noen ganger bobler eller andre symboler) på diagrammet ditt. Hvert punkt tilsvarer en observasjon i dataene dine.
Du har sikkert sett eller opprettet denne typen grafikk en million ganger, slik at du allerede vet at scatterplots bruker det kartesiske koordinatsystemet, der en variabel er kartlagt til
x
-aks og en andre variabel er kartlagt til
y -aksene. På nøyaktig samme måte lager du i ggplot2 en kartlegging mellom x -aks og
y -aksvariabler. Så, for å lage et plott av quakes-dataene, kartlegger du quakes $ long til x -aks og quakes $ lat til y -aks: >> ggplot (quakes, aes (x = lang, y = lat)) + geom_point () Slik lager du ggplot2 linjediagrammer For å lage et linjediagram bruker du geom_line () -funksjonen. Du bruker denne funksjonen på en veldig liknende måte til geom_point (), med forskjellen at geom_line () tegner en linje mellom påfølgende punkter i dataene dine. Denne typen diagram er nyttig for tidsseriedata i datarammer, for eksempel befolkningsdataene i det innebygde datasettet longley. For å lage et linjediagram over arbeidsledighetsfigurer bruker du følgende: >> ggplot (longley, aes (x = År, y = Arbeidsledig)) + geom_line ()