如何在正则表达式中匹配特定语言的字符?

How to match language specific chars in a regex?

我知道 \w 匹配任何单词字符 [a-zA-Z0-9_][\p{L}\p{N}_] 如果使用 (?u) 编译。

法语有 42 个字符[a-zàâæçéêëîïôœùûüÿ]。是否可以根据我的 locale 构建我的正则表达式。

如何将 [a-zàâæçéêëîïôœùûüÿ]\w 匹配?

部分答案是使用带有 \p{Latin} 的 unicode 正则表达式。

l 修饰符使匹配区域感知:

"foo" ~= m/\w/l;

不是直接使用 l,而是使用每个生物的 use locale link。