如果从 UTF-16 LE(使用 -u)转换为 UTF-8,使用 unicode 的 csvde 导出文件是否会丢失字符?
Does a csvde exported file using unicode lose characters if converted from UTF-16 LE (using -u) to UTF-8?
场景是这样的:
- 使用 csvde 和 -u 开关(对于 unicode)导出 Active Directory
- 输出是一个 UTF-16 LE 文件。
- 部分中文和阿拉伯字符导出成功
- 使用 Windows 记事本“另存为”UTF-8。
- 中文和阿拉伯字符正确显示。
假设 csvde 创建者选择 UTF-16 以避免在导出时丢失字符。使用记事本转换为 UTF-8 时,我们是否可能会丢失字符?如果有,是什么字符,能举个例子吗?
UTF-32、UTF-16 和 UTF-8 都支持所有 Unicode 代码点。没有损失。
仅供参考,Windows 上的“Unicode”通常真正意味着 UTF-16。 API 在内部使用 UTF-16。
场景是这样的:
- 使用 csvde 和 -u 开关(对于 unicode)导出 Active Directory
- 输出是一个 UTF-16 LE 文件。
- 部分中文和阿拉伯字符导出成功
- 使用 Windows 记事本“另存为”UTF-8。
- 中文和阿拉伯字符正确显示。
假设 csvde 创建者选择 UTF-16 以避免在导出时丢失字符。使用记事本转换为 UTF-8 时,我们是否可能会丢失字符?如果有,是什么字符,能举个例子吗?
UTF-32、UTF-16 和 UTF-8 都支持所有 Unicode 代码点。没有损失。
仅供参考,Windows 上的“Unicode”通常真正意味着 UTF-16。 API 在内部使用 UTF-16。