ASCII 和 Unicode 区别

ASCII and Unicode difference

[问这个问题的时候我还是本科生:P]

为什么了解 ASCII 和 Unicode 字符集的区别很重要?

我了解到ASCII是针对8位字节字符集的,Unicode目前的ver 6.3有100万个代码,其中0.1个分配给字符。

但是了解差异的重要性是什么?

我仅在 JSON 解析或网站元数据规范期间指定了字符集,而不知道其真正意义。

ASCII定义为7位码,最大为0x7F。 ASCII 是 Unicode 字符块之一的严格子集。

Unicode 可用于对许多不同书写系统中的许多不同字符进行编码,定义了数百万个字符。它通常用可变长度编码表示。 UTF-8 是最流行的西方语言编码。

根据设计,ASCII 已被编码为 UTF-8,因此将一段 ASCII 文本标记为 UTF-8 不会导致任何问题。

警告:许多人将 ASCII 与使用字符值大于 127 的许多 "Extended ASCII" 字符集混淆。扩展 ASCII 不是 UTF-8。