在 Python Pandas 中设置 csv 记录分隔符

Set csv record delimiter in Python Pandas

我使用 pandas python 库创建了一个脚本来合并几个 .csv 文件。所有文件都使用“\n\r”作为记录分隔符。 我 运行 遇到一个文件的问题,在特定字段中,有时会出现“\n”。这导致 pandas.read_csv 将其计为新行。

是否有机会(除了字段分隔符之外)指定记录分隔符?或者有更好的解决方案吗?

谢谢你,并致以最诚挚的问候

查看 pandas.read_csv

中的所有 kwargs

lineterminator 关键字:

lineterminator : str (length 1), default None
    Character to break file into lines. Only valid with C parser.

请注意,它需要使用 C 解析器(参见 engine kwarg)

鉴于您的行以 \r 结尾,即 carriage return character 我建议将其用作 lineterminator 并进行 post 处理以清理\n落后了。

我认为设置 lineterminator='\r' 应该可以解决您的问题。