如何在正则表达式中匹配特定语言的字符?
How to match language specific chars in a regex?
我知道 \w
匹配任何单词字符 [a-zA-Z0-9_]
或 [\p{L}\p{N}_]
如果使用 (?u)
编译。
法语有 42 个字符[a-zàâæçéêëîïôœùûüÿ]
。是否可以根据我的 locale
构建我的正则表达式。
如何将 [a-zàâæçéêëîïôœùûüÿ]
与 \w
匹配?
部分答案是使用带有 \p{Latin}
的 unicode 正则表达式。
l
修饰符使匹配区域感知:
"foo" ~= m/\w/l;
不是直接使用 l
,而是使用每个生物的 use locale
link。
我知道 \w
匹配任何单词字符 [a-zA-Z0-9_]
或 [\p{L}\p{N}_]
如果使用 (?u)
编译。
法语有 42 个字符[a-zàâæçéêëîïôœùûüÿ]
。是否可以根据我的 locale
构建我的正则表达式。
如何将 [a-zàâæçéêëîïôœùûüÿ]
与 \w
匹配?
部分答案是使用带有 \p{Latin}
的 unicode 正则表达式。
l
修饰符使匹配区域感知:
"foo" ~= m/\w/l;
不是直接使用 l
,而是使用每个生物的 use locale
link。