Innholdsfortegnelse:
Video: Data Analysis in R by Dustin Tran 2024
I mange tilfeller kan du trekke verdier fra en dataramme i R ved å late som om det er en matrise. Men selv om datarammer kan se ut som matriser, er de definitivt ikke. I motsetning til matriser og arrays lagres datarammer ikke internt som vektorer, men som lister over vektorer.
Forutsatt at det er en matrise
Hvis du vil trekke verdier fra en dataramme, kan du bare late som om det er en matrise og starte derfra. Du kan bruke indeksnumre, navn eller logiske vektorer til valg, som du ville med matriser. For eksempel kan du få antall kurver scoret av Geraldine i det tredje spillet som dette:
På samme måte kan du få alle kurvene som Granny scoret ved hjelp av kolonneindeksen, slik: >> kurver. df [1] [1] 12 4 5 6 9 3
Eller hvis du vil at dette skal være en dataramme, kan du bruke argumentet drop = FALSE akkurat som du gjør med matriser: >> str kurver. df [1, drop = FALSE]) 'data. ramme ': 6 obs. av 1 variabel: $ Granny: num 12 4 5 6 9 3
Merk at i motsetning til matriser blir radnavnene tapt hvis du ikke angir drop = FALSE-argumentet.
Sett din dollar der dataene dine er
Som en omhyggelig leser merket du allerede at hver variabel er foran et dollar tegn ($) i utgangen fra str (). R trenger ikke nødvendigvis pimping dataene dine her - dollarskiltet er rett og slett en bestemt måte for å få tilgang til variabler. For å få tilgang til variabelen Granny, kan du bruke dollarskiltet slik: >> kurver. df $ Granny [1] 12 4 5 6 9 3
Så du angir datarammen, etterfulgt av et dollarskilt og deretter navnet på variabelen. Du trenger ikke å omgjøre variabelenavnet med anførselstegn (som du vil når du bruker indeksene). R vil returnere en vektor med alle verdiene som finnes i variabelen. Merk igjen at radnavnene er tapt her.Med denne dollar-tegnmetoden kan du bare få tilgang til én variabel av gangen. Hvis du vil ha tilgang til flere variabler samtidig, bruker du navnene dine, må du bruke firkantede parenteser.