Video: The Agricultural Revolution: Crash Course World History #1 2024
R støtter konseptet med vanlige uttrykk, som lar deg søke etter mønstre i tekst. Du har kanskje aldri hørt om regulære uttrykk, men du er sikkert kjent med det brede konseptet. Hvis du noen gang har brukt en * eller en? å angi hvilket som helst brev i et ord, så har du brukt en form for jokertegn. Regelmessige uttrykk støtter ideen om jokertegn og mye mer.
Vanlige uttrykk tillater tre måter å lage et søkemønster mer generelt enn et enkelt, fast uttrykk:
-
Alternativer: Du kan søke etter forekomster av ett eller annet mønster, angitt av | symbol. For eksempel matcher strand | bøk både strand og bøk.
På engelsk og amerikansk engelsk tastatur, kan du vanligvis finne | på samme tast som backslash ().
-
Gruppering: Du grupperer mønstre sammen med parenteser (). For eksempel skriver du (a | e) ch for å finne både strand og bøk.
-
Kvantifikatorer: Du angir om et element i mønsteret må gjentas eller ikke, ved å legge til * (forekommer null eller mange ganger) eller + (forekommer en eller mange ganger). For eksempel, for å finne enten bach eller bøk (null eller mer av a og e men ikke begge), bruker du b e * | a *) lm.
Prøv følgende eksempler. Først oppretter du en ny variabel med fem ord: >> rwords <- c ("bach", "back", "beech", "beach", "black")
Finn enten
strand > eller bøk ved hjelp av alternativ matchning:
Til slutt, bruk kvantifiseringsmodifikasjonen for å trekke ut
bach < og
bøk
men ikke
strand:
rwords [grep ("b (e * | a *) ch", rwords)] [1] "bach" "bøk" > For å finne mer hjelp i R om vanlige uttrykk, se på Hjelp-siden? regexp. Noen andre gode ressurser for å lære mer om vanlige uttrykk er Wikipedia, og hvor du finner en hurtigstartguide og opplæringsprogrammer.