Python如何检测'Combined Characters'?
Python how to Detect 'Combined Characters'?
我正在尝试编写一些 python 代码来检测字符串是否包含 'combined characters',我认为它是 Unicode 的一部分。现在,不仅是简单的角色,而且更像是这样的:S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄确实很烦人。无论如何,任何帮助都很棒,谢谢!哦,当我说 'detect' 代码应该 return a 'true' 如果它存在。万分感谢!我知道我问了很多
从Wikipedia开始,这些字符位于U+0300(768)到U+036F(879)的unicode码位,所以在Python中可以这样获取字符:
combining_marks = set(map(unichr, range(768, 880)))
要查找您的字符串中有哪些此类字符:
combining_marks.intersection(my_string)
我正在尝试编写一些 python 代码来检测字符串是否包含 'combined characters',我认为它是 Unicode 的一部分。现在,不仅是简单的角色,而且更像是这样的:S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄S̶̶̸̡̝̤͚͉͖͔̱̳̞̃̃̃ͦͮͨͫ́ͣ̽͋̉̐̔̉̄确实很烦人。无论如何,任何帮助都很棒,谢谢!哦,当我说 'detect' 代码应该 return a 'true' 如果它存在。万分感谢!我知道我问了很多
从Wikipedia开始,这些字符位于U+0300(768)到U+036F(879)的unicode码位,所以在Python中可以这样获取字符:
combining_marks = set(map(unichr, range(768, 880)))
要查找您的字符串中有哪些此类字符:
combining_marks.intersection(my_string)