有没有不遵守 ASCII 的字符集?
Are there any character sets that don't respect ASCII?
据我了解,字符编码将位映射为整数,字符集将整数映射为字符。
所以在Unicode字符集中有一个电话字符。它使用整数 9742 表示,更常见的是使用十六进制表示为 260E。然后使用 UTF-8 将其保存到一个文件中,该文件将整数 9742 转换为 10011000001110。如果我错了,请纠正我。
昨天我创建了一个使用 Unicode 字符集和 UTF-8 编码的文本文件,并将其保存到我的桌面。然后,我在我的文本编辑器中重新打开该文件,并开始手动切换字符集来取乐。毫不奇怪,开始显示问题和奇怪的字符!我注意到只有一些字符被歪曲了。这让我开始思考,为什么只有一些字符会损坏?为什么不是全部?
有人告诉我,乱码是原来的ASCII规范之外的字符。经过深思熟虑,这似乎是有道理的,因为只有非美国字符才会中断。有人告诉我,因为所有字符集都使用 ASCII 字符设置到前 128 个字符,所以它们将保持完整,而超过 127 个字符会中断。如有不妥请指正
终于想到了。有没有不遵守 ASCII 的字符集?如果有,它们叫什么,有什么用?
据我了解,字符编码将位映射为整数,字符集将整数映射为字符。
所以在Unicode字符集中有一个电话字符。它使用整数 9742 表示,更常见的是使用十六进制表示为 260E。然后使用 UTF-8 将其保存到一个文件中,该文件将整数 9742 转换为 10011000001110。如果我错了,请纠正我。
昨天我创建了一个使用 Unicode 字符集和 UTF-8 编码的文本文件,并将其保存到我的桌面。然后,我在我的文本编辑器中重新打开该文件,并开始手动切换字符集来取乐。毫不奇怪,开始显示问题和奇怪的字符!我注意到只有一些字符被歪曲了。这让我开始思考,为什么只有一些字符会损坏?为什么不是全部?
有人告诉我,乱码是原来的ASCII规范之外的字符。经过深思熟虑,这似乎是有道理的,因为只有非美国字符才会中断。有人告诉我,因为所有字符集都使用 ASCII 字符设置到前 128 个字符,所以它们将保持完整,而超过 127 个字符会中断。如有不妥请指正
终于想到了。有没有不遵守 ASCII 的字符集?如果有,它们叫什么,有什么用?