Ubuntu/Bash 上的字符编码问题
Character Encoding Issue on Ubuntu/Bash
我想要 cat 一个瑞典语 txt 文件。
对于特殊字符(如 ä 或 é),我返回这些字符:�.
例如。
�r han fr�n Apornas 星球。
我有来自多个来源的多个文件,其中一些返回了正确的结果,(例如 Det här är fel!)其中一些产生了上述问题。
基于此,我很确定问题出在文件的字符 (en) 编码上,但我就是找不到如何在命令行对文件进行编码。
我试过:
iconv -f UTF-8 -t UTF-16 file.txt
和类似的。
但我一直都收到错误消息。
你有什么建议吗?
谢谢!
根据评论,解决方案是:
首先执行:
chardet file.txt
找出字符编码。
然后:
iconv -f iso-8859-1 -t utf-8 file.txt
创建 "translation"。
我想要 cat 一个瑞典语 txt 文件。
对于特殊字符(如 ä 或 é),我返回这些字符:�.
例如。 �r han fr�n Apornas 星球。
我有来自多个来源的多个文件,其中一些返回了正确的结果,(例如 Det här är fel!)其中一些产生了上述问题。
基于此,我很确定问题出在文件的字符 (en) 编码上,但我就是找不到如何在命令行对文件进行编码。
我试过:
iconv -f UTF-8 -t UTF-16 file.txt
和类似的。 但我一直都收到错误消息。
你有什么建议吗? 谢谢!
根据评论,解决方案是:
首先执行:
chardet file.txt
找出字符编码。
然后:
iconv -f iso-8859-1 -t utf-8 file.txt
创建 "translation"。