如何使用 sublime text 中的代码点搜索 unicode 字符
How to search a unicode character using its code point in sublime text
据我了解,unicode 字符有多种表示形式。
例如代码点或十六进制字节(如果使用 UTF-8 编码,这两种表示并不总是相同)。
如果我想搜索一个可见的 unicode 字符(例如,汉
),我可以复制它并进行搜索。即使我不知道它的底层 unicode 表示形式,它也能工作。但是对于其他一些不容易看到的字符,比如zeros width space,这种方式就不太适用了。对于这些字符,我们可能希望使用其代码点进行搜索。
我的问题
如果我知道一个字符的代码点,我如何使用正则表达式在 sublime text 中搜索它?我突出显示 sublime text 因为不同的编辑器可能使用不同的格式。
- 零宽度 space 个字符可以通过以下方式找到:
\x{200b}
- 不间断 space 个字符可以通过以下方式找到:
\xa0
对于code point为CODE_POINT
的unicode字符(code point必须是十六进制格式),我们可以安全地使用格式\x{CODE_POINT}
的正则表达式来搜索它。
一般规则
对于码点可以容纳两个十六进制数字的unicode字符,可以使用不带花括号的\x
,但是对于码点超过两个十六进制数字的字符,则必须使用\x
后跟花括号。
一些例子
例如,要查找字符 A
,您可以使用 \x{41}
或 \x41
来搜索它。
再举个例子,为了找到我
(根据here,它的代码点是U+6211
),你必须 使用 \x{6211}
而不是 \x6211
来搜索它(见下图)。如果使用\x6211
,将找不到字符我
.
据我了解,unicode 字符有多种表示形式。
例如代码点或十六进制字节(如果使用 UTF-8 编码,这两种表示并不总是相同)。
如果我想搜索一个可见的 unicode 字符(例如,汉
),我可以复制它并进行搜索。即使我不知道它的底层 unicode 表示形式,它也能工作。但是对于其他一些不容易看到的字符,比如zeros width space,这种方式就不太适用了。对于这些字符,我们可能希望使用其代码点进行搜索。
我的问题
如果我知道一个字符的代码点,我如何使用正则表达式在 sublime text 中搜索它?我突出显示 sublime text 因为不同的编辑器可能使用不同的格式。
- 零宽度 space 个字符可以通过以下方式找到:
\x{200b}
- 不间断 space 个字符可以通过以下方式找到:
\xa0
对于code point为CODE_POINT
的unicode字符(code point必须是十六进制格式),我们可以安全地使用格式\x{CODE_POINT}
的正则表达式来搜索它。
一般规则
对于码点可以容纳两个十六进制数字的unicode字符,可以使用不带花括号的\x
,但是对于码点超过两个十六进制数字的字符,则必须使用\x
后跟花括号。
一些例子
例如,要查找字符 A
,您可以使用 \x{41}
或 \x41
来搜索它。
再举个例子,为了找到我
(根据here,它的代码点是U+6211
),你必须 使用 \x{6211}
而不是 \x6211
来搜索它(见下图)。如果使用\x6211
,将找不到字符我
.