如何使用 sublime text 中的代码点搜索 unicode 字符

How to search a unicode character using its code point in sublime text

据我了解,unicode 字符有多种表示形式。

例如代码点或十六进制字节(如果使用 UTF-8 编码,这两种表示并不总是相同)。

如果我想搜索一个可见的 unicode 字符(例如,),我可以复制它并进行搜索。即使我不知道它的底层 unicode 表示形式,它也能工作。但是对于其他一些不容易看到的字符,比如zeros width space,这种方式就不太适用了。对于这些字符,我们可能希望使用其代码点进行搜索。

我的问题

如果我知道一个字符的代码点,我如何使用正则表达式在 sublime text 中搜索它?我突出显示 sublime text 因为不同的编辑器可能使用不同的格式。

  1. 零宽度 space 个字符可以通过以下方式找到:

\x{200b}

Demo

  1. 不间断 space 个字符可以通过以下方式找到:

\xa0

Demo

对于code pointCODE_POINT的unicode字符(code point必须是十六进制格式),我们可以安全地使用格式\x{CODE_POINT}的正则表达式来搜索它。

一般规则

对于码点可以容纳两个十六进制数字的unicode字符,可以使用不带花括号的\x,但是对于码点超过两个十六进制数字的字符,则必须使用\x 后跟花括号。

一些例子

例如,要查找字符 A,您可以使用 \x{41}\x41 来搜索它。

再举个例子,为了找到(根据here,它的代码点是U+6211),你必须 使用 \x{6211} 而不是 \x6211 来搜索它(见下图)。如果使用\x6211,将找不到字符.