Video: DNA, Hot Pockets, & The Longest Word Ever: Crash Course Biology #11 2024
En samling av kombinerte bokstaver og ord kalles en streng. Når du arbeider med tekst, må du kunne sammenkalle ord (streng dem sammen) og splitte dem fra hverandre. I R, bruker du funksjonen lim () til å sammenkoble og strsplit () -funksjonen kan deles. I denne delen viser vi deg hvordan du bruker begge funksjonene.
Opprett først en tegnvektor kalt pangram, og tilordne verdien verdien "Den raske brune ræven hopper over den dovne hunden", som følger:
pangram pangram [1] "Den raske brune ræven hopper over den dovne hunden"For å dele denne teksten i ordgrenser (mellomrom), kan du bruke strsplit () som følger: >> strsplit (pangram, "" [[1]] [1] "The" "quick" "brown" "Fox" "hopper" hunden "
Legg merke til at den uvanlige første linjen av strsplit () s utgang består av [[1]]. På samme måte som R viser vektorer, betyr [[1]] at R viser det første elementet i en liste. Lister er ekstremt viktige begreper i R; de lar deg kombinere alle slags variabler.
For å trekke ut et element fra en liste, må du bruke dobbelte firkantede parenteser. Del din pangram i ord, og tilordne det første elementet til en ny variabel som kalles ord, ved hjelp av dobbeltsidige parenteser ([[]]), som følger:
ordord [1] "The" "quick" " brun "" fox "" hopper "" over "" den "" lat "" hunden "
For å finne de unike elementene i en vektor, inkludert en vektor med tekst, bruker du den unike () -funksjonen. I de variable ordene vises "the" to ganger: en gang i små bokstaver og en gang med det første bokstaver aktivert. For å få en liste over de unike ordene, konvertere først ord til små bokstaver og bruk deretter unike:
999 >> unikt (tolower (ord)) [1] "" rask "" brun "" fox "" hopper "" over "" lat "[8]" hund "