Vidéo: LES EXPRESSIONS REGULIERES (REGEX) 2025
R prend en charge le concept d'expressions régulières, ce qui vous permet de rechercher des motifs dans le texte. Vous n'avez peut-être jamais entendu parler d'expressions régulières, mais vous connaissez probablement le concept général. Si vous avez déjà utilisé un * ou un? Pour indiquer une lettre dans un mot, vous avez utilisé une forme de recherche générique. Les expressions régulières prennent en charge l'idée de caractères génériques et bien plus encore.
Les expressions régulières permettent trois façons de rendre un motif de recherche plus général qu'une seule expression fixe:
-
Alternatives: Vous pouvez rechercher des occurrences d'un motif ou d'un autre, indiquées par le | symbole. Par exemple plage | hêtre correspond à la fois plage et hêtre.
Sur les claviers anglais anglais et américain, vous pouvez généralement trouver le | sur la même clé que la barre oblique inverse ().
-
Regroupement: Vous groupez des motifs ensemble en utilisant des parenthèses (). Par exemple, vous écrivez be (a | e) ch pour trouver à la fois plage et hêtre.
-
Quantificateurs: Vous spécifiez si un élément du motif doit être répété ou non en ajoutant * (apparaît zéro ou plusieurs fois) ou + (apparaît une ou plusieurs fois). Par exemple, pour trouver bach ou hêtre (zéro ou plus de a et e mais pas les deux), vous utilisez b (e * | a *) ch.
Essayez les exemples suivants. Commencez par créer une nouvelle variable avec cinq mots:
rwords <- c ("bach", "back", "hêtre", "beach", "black")
Trouvez soit plage > ou hêtre en utilisant une correspondance alternative:
Utilisez maintenant la règle de regroupement pour extraire les mêmes mots: >> rwords [grep ("être (a | e) ch", rwords)] [1] "hêtre" "plage"
Enfin, utilisez la modification du quantificateur pour extraire
bach < et
hêtre
mais pas
plage: rwords [grep ("b (e * | a *) ch", rwords)] [1] "bach" "hêtre" > Pour trouver plus d'aide dans R sur les expressions régulières, consultez la page d'aide? regexp. Quelques autres grandes ressources pour en apprendre davantage sur les expressions régulières sont Wikipedia et, où vous pouvez trouver un guide de démarrage rapide et des tutoriels.
