Slik bruker du vanlige uttrykk i R-dummies <[SET:descriptionno]R støtter konseptet med vanlige uttrykk, som gjør at du kan bruke vanlig uttrykk i R

Video: The Agricultural Revolution: Crash Course World History #1 2024

R støtter konseptet med vanlige uttrykk, som lar deg søke etter mønstre i tekst. Du har kanskje aldri hørt om regulære uttrykk, men du er sikkert kjent med det brede konseptet. Hvis du noen gang har brukt en * eller en? å angi hvilket som helst brev i et ord, så har du brukt en form for jokertegn. Regelmessige uttrykk støtter ideen om jokertegn og mye mer.

Vanlige uttrykk tillater tre måter å lage et søkemønster mer generelt enn et enkelt, fast uttrykk:

Alternativer: Du kan søke etter forekomster av ett eller annet mønster, angitt av | symbol. For eksempel matcher strand | bøk både strand og bøk.

På engelsk og amerikansk engelsk tastatur, kan du vanligvis finne | på samme tast som backslash ().
Gruppering: Du grupperer mønstre sammen med parenteser (). For eksempel skriver du (a | e) ch for å finne både strand og bøk.
Kvantifikatorer: Du angir om et element i mønsteret må gjentas eller ikke, ved å legge til * (forekommer null eller mange ganger) eller + (forekommer en eller mange ganger). For eksempel, for å finne enten bach eller bøk (null eller mer av a og e men ikke begge), bruker du b e * | a *) lm.

Prøv følgende eksempler. Først oppretter du en ny variabel med fem ord: >> rwords <- c ("bach", "back", "beech", "beach", "black")

Finn enten

strand > eller bøk ved hjelp av alternativ matchning:

>> grep ("beach | beech", rwords) [1] 3 4 Dette betyr at søkestrengen ble funnet i elementene 3 og 4 av rwords. For å trekke ut de faktiske elementene, kan du bruke subsetting med firkantede parenteser: >> rwords [grep ("beach | beech", rwords)] [1] "bøk" "strand"

Bruk nå grupperingsregelen til å trekke ut De samme ordene: >> rwords [grep ("be (a | e) ch", rwords)] [1] "bøk" "strand"

Til slutt, bruk kvantifiseringsmodifikasjonen for å trekke ut

bach < og

bøk

men ikke

strand:

rwords [grep ("b (e * | a *) ch", rwords)] [1] "bach" "bøk" > For å finne mer hjelp i R om vanlige uttrykk, se på Hjelp-siden? regexp. Noen andre gode ressurser for å lære mer om vanlige uttrykk er Wikipedia, og hvor du finner en hurtigstartguide og opplæringsprogrammer.