Unicode 字符名称的官方存储库
Official repository of Unicode character names
有几种方法可以获取所有 Unicode 字符名称的列表:例如使用 Python 模块 unicodedata
, as explained in , or using the website: https://unicode.org/charts/charindex.html 但这里不完整,您必须打开并解析 PDF 才能找到名字。
但是所有 Unicode 字符名称的官方来源/存储库是什么?(这样如果添加了新字符,列表就会更新,所以我正在寻找这些名称的初始来源,采用机器可读格式)。
我正在寻找仅包含 code point
和 name
的列表,格式为 CSV 或任何其他格式:
code character name
...
0102 LATIN CAPITAL LETTER A WITH BREVE
0103 LATIN SMALL LETTER A WITH BREVE
...
实际角色数据(包括角色名称和许多其他详细信息)的官方来源是 the Unicode Character Database。
可以通过http://www.unicode.org/Public/UCD/latest/访问最新版本的数据文件。
具体名称可以在the files NamesList.txt
. The format of that file is described here中找到。
这是 CSV 格式的列表:https://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt
有几种方法可以获取所有 Unicode 字符名称的列表:例如使用 Python 模块 unicodedata
, as explained in
但是所有 Unicode 字符名称的官方来源/存储库是什么?(这样如果添加了新字符,列表就会更新,所以我正在寻找这些名称的初始来源,采用机器可读格式)。
我正在寻找仅包含 code point
和 name
的列表,格式为 CSV 或任何其他格式:
code character name
...
0102 LATIN CAPITAL LETTER A WITH BREVE
0103 LATIN SMALL LETTER A WITH BREVE
...
实际角色数据(包括角色名称和许多其他详细信息)的官方来源是 the Unicode Character Database。
可以通过http://www.unicode.org/Public/UCD/latest/访问最新版本的数据文件。
具体名称可以在the files NamesList.txt
. The format of that file is described here中找到。
这是 CSV 格式的列表:https://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt