Innholdsfortegnelse:
- Legge til en enkelt variabel
- Selv om radnavnene til datarammerne er nye. df og kurver. df differ, R vil ignorere dette og bare bruke radnavnene til den første datarammen i cbind () -funksjonen, som du kan se fra utgangen av følgende kode: >> hode (cbind (kurver. df, ny .df), 4) Granny Geraldine Gabrielle Gertrude Guinevere 1. 12 5 11 3 6 2 4 4 5 5 9 3 5 2 6 2 7 4 6 4 7 1 3
Video: Data Analysis in R by Dustin Tran 2025
En dataramme kan utvides med nye variabler i R. Du kan for eksempel få data fra en annen spiller på Granny's team. Eller kanskje du vil beregne en ny variabel fra de andre variablene i datasettet, som summen av kurver laget i hvert spill.
Legge til en enkelt variabel
Det er tre hovedalternativer for å legge til en variabel. I likhet med tilfellet med å legge til observasjoner, kan du bruke enten cbind () -funksjonen eller indeksene.
Du kan også bruke dollarskiltet til å legge til en ekstra variabel. Tenk deg at Granny ba deg om å legge til antall kurver av venninnen Gabrielle til datarammen. Først vil du opprette en vektor med dataene som dette: >> kurver. av. Gabrielle <- c (11, 5, 6, 7, 3, 12, 4, 5, 9)
For å lage en ekstra variabel navngitt Gabrielle med dataene, gjør du bare: >> kurver. df $ Gabrielle <- kurver. av. Gabrielle
Hvis du vil sjekke om dette virket, men du ikke vil vise fullstendig dataramme, kan du bruke hodet () -funksjonen. Denne funksjonen tar to argumenter: objektet du vil vise, og antall rader du vil se. For å se de første fire radene i den nye datarammen, kurver. df, bruk følgende kode:
>> hode (kurver. Df, 4) Granny Geraldine Gabrielle 1ste 12 5 11 2 4 4 5 3 5 2 6 4 6 4 7
Legge til flere variabler ved hjelp av bånd
Du kan la ut datastammen din er en matrise og bruk funksjonen cbind () for å gjøre dette. I motsetning til når du bruker rbind () på datarammer, trenger du ikke engang å bekymre deg for rad- eller kolonnens navn. La oss lage en ny dataramme med målene for Gertrude og Guinevere. For å kombinere begge i en dataramme, prøv:>> ny. df <- data. ramme (+ Gertrude = c (3, 5, 2, 1, NA, 3, 1, 1, 4), + Guinevere = c (6, 9, 7, 3, 3, 6, 2, 10, 6) +)
Selv om radnavnene til datarammerne er nye. df og kurver. df differ, R vil ignorere dette og bare bruke radnavnene til den første datarammen i cbind () -funksjonen, som du kan se fra utgangen av følgende kode: >> hode (cbind (kurver. df, ny.df), 4) Granny Geraldine Gabrielle Gertrude Guinevere 1. 12 5 11 3 6 2 4 4 5 5 9 3 5 2 6 2 7 4 6 4 7 1 3
Når du bruker en dataramme eller en matrise med kolonneavn, R vil bruke disse som navnene på variablene. Hvis du bruker cbind () for å legge til en vektor i en dataramme, vil R bruke vektorens navn som variabelnavn, med mindre du spesifiserer en selv, som du gjorde med rbind ().
Hvis du binder en matrise uten kolonnenavn til datarammen, bruker R automatisk kolonnene som navn.Det vil føre til litt problemer selv, fordi enkle tall er ugyldige objektnavn og dermed vanskeligere å bruke som variable navn. I dette tilfellet kan du bedre bruke indeksene.Når du vil bruke en dataramme og ikke vil fortsette å skrive navnet sitt etterfulgt av $, kan du bruke funksjonene med () og innenfor (). Med funksjonen within () kan du også enkelt legge til variabler i en dataramme.
