编码:尝试将带有中文字符的 ISO-8859-15 字符串解码为 UTF-8 字符串是否有意义?
Encoding: does it make sense trying to decode an ISO-8859-15 string with chinese characters into UTF-8 string?
我在一个文件中存储了以下用 ISO-8859-15 编码的字符串:
DEBUG_RECEIVED: ????
正确的 UTF-8 字符串是:
DEBUG_RECEIVED: 测试手机
尝试将那些错误的 ????
字符再次转换为 测试手机
是否有意义(因此再次从 ISO-8859-15 转换为 UTF-8),或者由于ISO-8859-15 不针对汉字起诉,因为它每个字符使用 8 位,汉字所需的 16 位就这么简单地丢失了吗?
当我尝试以下操作时:
echo "DEBUG_RECEIVED: ????" | iconv -f iso-8859-15 -t utf-8
我仍然得到 DEBUG_RECEIVED: ????
作为输出。
我对此有点困惑,请,如果您能详细说明一下,那就太好了。
感谢关注
是的,无论生成 8859-15 字符串都必须丢弃表示汉字所需的信息。
丢失的信息丢失了 – 您的汉字似乎已被 ?
替换,并且没有任何东西可以恢复它们。
我在一个文件中存储了以下用 ISO-8859-15 编码的字符串:
DEBUG_RECEIVED: ????
正确的 UTF-8 字符串是:
DEBUG_RECEIVED: 测试手机
尝试将那些错误的 ????
字符再次转换为 测试手机
是否有意义(因此再次从 ISO-8859-15 转换为 UTF-8),或者由于ISO-8859-15 不针对汉字起诉,因为它每个字符使用 8 位,汉字所需的 16 位就这么简单地丢失了吗?
当我尝试以下操作时:
echo "DEBUG_RECEIVED: ????" | iconv -f iso-8859-15 -t utf-8
我仍然得到 DEBUG_RECEIVED: ????
作为输出。
我对此有点困惑,请,如果您能详细说明一下,那就太好了。
感谢关注
是的,无论生成 8859-15 字符串都必须丢弃表示汉字所需的信息。
丢失的信息丢失了 – 您的汉字似乎已被 ?
替换,并且没有任何东西可以恢复它们。