UTF-8 和 en_AU.UTF-8 之间的区别
Difference between UTF-8 and en_AU.UTF-8
我有一些 UTF-8 格式的文本,但它在文本编辑器中仍然显示不正常(文本编辑器设置了 UTF-8 编码)。我知道,例如 ISO8859-2 是一种与 ascii 兼容的字节编码,它具有特定于领土的 128 个高值,因此来自该领土的人仍然可以使用一个字节编码来显示不属于 ascii 且不需要的字符使用像 UTF-8 这样的多字节编码。 en_AU.UTF-8 的 en_AU 部分有何用途?难道这就是为什么我仍然看到我的文本混乱的原因,即使它是 UTF-8 格式的?我的意思是当使用 en_AU 时,某些值应该映射到不同的字符?据我了解 UTF-8 这是不可能的,但这是最后一件事,它可能是文本混乱的原因。
linux
上 locale 命令的输出
LANG=en_US.UTF-8
LANGUAGE=en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=cs_CZ.UTF-8
LC_TIME=cs_CZ.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=cs_CZ.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=cs_CZ.UTF-8
LC_NAME=cs_CZ.UTF-8
LC_ADDRESS=cs_CZ.UTF-8
LC_TELEPHONE=cs_CZ.UTF-8
LC_MEASUREMENT=cs_CZ.UTF-8
LC_IDENTIFICATION=cs_CZ.UTF-8
LC_ALL=
在 UNIX 系统中,语言环境是磁盘上的文件,它们以特定的编码进行编码。所以你可能在不同的编码中有相同的语言环境,例如en_AU.iso55891
和 en_AU.UTF-8
。这不是 UTF-8 的某种变体,而是这个特定语言环境文件的变体。如果您的语言环境正在使用语言环境的 UTF-8 变体,那么任何使用语言环境系统的东西都将输出 UTF-8 编码值。
我有一些 UTF-8 格式的文本,但它在文本编辑器中仍然显示不正常(文本编辑器设置了 UTF-8 编码)。我知道,例如 ISO8859-2 是一种与 ascii 兼容的字节编码,它具有特定于领土的 128 个高值,因此来自该领土的人仍然可以使用一个字节编码来显示不属于 ascii 且不需要的字符使用像 UTF-8 这样的多字节编码。 en_AU.UTF-8 的 en_AU 部分有何用途?难道这就是为什么我仍然看到我的文本混乱的原因,即使它是 UTF-8 格式的?我的意思是当使用 en_AU 时,某些值应该映射到不同的字符?据我了解 UTF-8 这是不可能的,但这是最后一件事,它可能是文本混乱的原因。
linux
上 locale 命令的输出LANG=en_US.UTF-8
LANGUAGE=en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=cs_CZ.UTF-8
LC_TIME=cs_CZ.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=cs_CZ.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=cs_CZ.UTF-8
LC_NAME=cs_CZ.UTF-8
LC_ADDRESS=cs_CZ.UTF-8
LC_TELEPHONE=cs_CZ.UTF-8
LC_MEASUREMENT=cs_CZ.UTF-8
LC_IDENTIFICATION=cs_CZ.UTF-8
LC_ALL=
在 UNIX 系统中,语言环境是磁盘上的文件,它们以特定的编码进行编码。所以你可能在不同的编码中有相同的语言环境,例如en_AU.iso55891
和 en_AU.UTF-8
。这不是 UTF-8 的某种变体,而是这个特定语言环境文件的变体。如果您的语言环境正在使用语言环境的 UTF-8 变体,那么任何使用语言环境系统的东西都将输出 UTF-8 编码值。