如何在文件中找到 PS(段落分隔符)?

How to find PS (paragraph separator character) in file?

我在 VSCode 中打开了一个 XML 文件。

VSCode 警告我有不寻常的行终止符,例如 paragraph separator.

使用与 git bash 捆绑的实用程序用于 windows 或 python,如何找到文件中的所有段落分隔符?

我不是 100% 确定您要的是什么,但一个好的正则表达式应该可以完成这项工作。

这应该适用于 bash,其中 unicode 可以打印为 $'\u2029':

sed $'s/\u2029/HERE(&)/g' file.xml
  • & 替换为段落分隔符。在终端中,它可能看起来像 HERE().

  • 或者可以使用 sed $'s/\u2029/HERE/g' 以防它弄乱终端。

  • grep $'\u2029' 将列出包含它们的行。

还有

hd file.xml | grep --color=always 'e2 80 a9'

您可以通过以下方式永久删除它们:

sed -i $'s/\u2029//g' file.xml