如何使用正则表达式拆分非字母数字字符中的 Unicode 字符串?
How to split Unicode string in non-Alphanumeric characters with regular expression?
我想拆分包含 non_Alphanumeric 个字符上的 unicode 字词的字符串,例如 space、CRLF 等
例如:
AStr := 'امین Bob(Alice)';
我正在寻找将 AStr
拆分为以下列表的正则表达式:
امین
Bob
Alice
看完Regex Tutorial - Unicode Characters and Properties: Unicode Categories才知道答案是:
AnArray := TRegEx.Split(ADataStr, '[^\p{L}\p{N}]+');
我想拆分包含 non_Alphanumeric 个字符上的 unicode 字词的字符串,例如 space、CRLF 等
例如:
AStr := 'امین Bob(Alice)';
我正在寻找将 AStr
拆分为以下列表的正则表达式:
امین
Bob
Alice
看完Regex Tutorial - Unicode Characters and Properties: Unicode Categories才知道答案是:
AnArray := TRegEx.Split(ADataStr, '[^\p{L}\p{N}]+');