如何获得正确大小的子字符串?
How to get correct size of substring?
我想正确匹配子字符串。
re:run("étude", "é",[unicode]).
运行这段代码的结果是{match,[{0,2}]}
。这个结果看起来像我使用了 unnormilize Unicode 字符串。
所以接下来我尝试添加规范化:
re:run(unicode:characters_to_nfc_list("étude"), unicode:characters_to_nfc_list("é"),[unicode]).
结果是一样的:{match,[{0,2}]}
如何描述Erlang(我需要设置什么样的选项)以获得正确的字符大小结果?我想要 {match,[{0,1}]}
尝试 ucp 而不是 unicode 选项。
>re:run("étude", "é",[ucp]).
{match,[{0,1}]}
我想正确匹配子字符串。
re:run("étude", "é",[unicode]).
运行这段代码的结果是{match,[{0,2}]}
。这个结果看起来像我使用了 unnormilize Unicode 字符串。
所以接下来我尝试添加规范化:
re:run(unicode:characters_to_nfc_list("étude"), unicode:characters_to_nfc_list("é"),[unicode]).
结果是一样的:{match,[{0,2}]}
如何描述Erlang(我需要设置什么样的选项)以获得正确的字符大小结果?我想要 {match,[{0,1}]}
尝试 ucp 而不是 unicode 选项。
>re:run("étude", "é",[ucp]).
{match,[{0,1}]}