如何在正则表达式中匹配特定语言的字符？

Question

我知道 \w 匹配任何单词字符 [a-zA-Z0-9_] 或 [\p{L}\p{N}_] 如果使用 (?u) 编译。

法语有 42 个字符[a-zàâæçéêëîïôœùûüÿ]。是否可以根据我的 locale 构建我的正则表达式。

如何将 [a-zàâæçéêëîïôœùûüÿ] 与 \w 匹配？

部分答案是使用带有 \p{Latin} 的 unicode 正则表达式。

Answer 1

l 修饰符使匹配区域感知：

"foo" ~= m/\w/l;

不是直接使用 l，而是使用每个生物的 use locale link。

How to match language specific chars in a regex?