Video: Data Analysis in R by Dustin Tran 2024
Vektorer, lister og datarammer spiller en viktig rolle i å representere data i R, så det er viktig å kunne kortfattet og korrekt spesifisere en delmengde av dataene dine.
Det er tre hovedoperatører som du kan bruke til å dele inn dataene dine:
-
$: Ekstraherer et enkelt element etter navn fra en liste eller dataramme. For eksempel iris $ Sepal. Lengde trekker ut kolonnen Sepal. Lengde fra datarammen iris.
-
[[: Ekstraherer et enkelt element etter navn eller posisjon fra en liste eller dataramme. For eksempel iris [["Sepal. Lengde "]] trekker ut kolonnen Sepal. Lengde fra datarammen; iris; iris [[2]] trekker ut det andre elementet fra iris.
-
[: Extracts flere elementer fra en vektor, en rekke, en liste eller en dataramme. For eksempel trekker iris [c ("Sepal. Length", "Species") ut kolonnene Sepal. Lengde og art fra iris; iris [1: 10,] trekker ut de første ti radene fra iris; og iris [1: 10, "Arter"] trekker ut de ti første elementene i kolonnen Arter fra iris.
Bevegelsesdelingsoperatøren, [lar deg returnere flere elementer. Du angir delmengden på en av fem måter:
-
Blank: Returnerer alt. For eksempel returnerer iris [] alle iris.
-
Positive tall: Inkluderer bare disse elementene. For eksempel trekker iris [1: 100, 5] ut de første hundre elementene i den femte kolonnen av iris.
-
Negativt tall: Ekskluderer disse elementene. For eksempel utelukker iris [- (1: 100)] de første hundre radene fra iris, mens iris [-5] utelukker den femte kolonnen fra iris.
-
Logisk: Inkluderer hvis SANT; utelukker hvis feil. For eksempel trekker iris [iris $ Arter == "setosa",] bare de radene fra iris der artverdien er "setosa".
-
Navn: Inkluderer alle navn som samsvarer. For eksempel trekker iris [c ("Species", "Petal. Width") ut kolonnene Arter og Petal. Bredde fra iris.