如何替换文件中的unicode字符?

How to replace unicode character in file?

我正在使用 java 读取一个文件并使用“\u0001”作为字段分隔符。 此文件存在于 linux 机器中。

但是当我执行 head filename 时,我看不到“\u0001”作为文件中的字段分隔符。我可以知道如何在终端上查看文件中的字段分隔符吗?如何在终端上用其他东西替换“\u0001”?

这有帮助吗?:

`cat -A filename|head`

cat -A 显示所有字符,但是即使你可以看到这些 invisible 字符,我不确定你将如何在控制台中分离这些字符.. 或使用这样的字符作为普通控制台上的分隔符..

如果您只是想在显示文件时使用不同的字符以使其更易于阅读:

tr $'\u0001' ',' < thefile.txt

(假设您使用的是 bash 或另一个支持 $'string' style escapes 的 shell)