Pandas read_csv 字符串内的 EOF 从行开始
Pandas read_csv EOF inside string starting at line
我遇到了 pandas read_csv 的问题。我有一个文件,其中包含 " 作为字段值。实际上,情况并非如此,但我对文件生成没有影响,因此我必须找到解决方法。
pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 15345
我在 Git (link here) 上发现了一个问题报告,他们建议使用用于 "sep" 参数的定界符,也用于 "quotechar"。在这种情况下,文件结构会变得混乱。
我做的另一件事是为此添加一个例外,它将 运行 为其余文件编码,但我将继续为该特定类型的文件遇到这个问题。
我用来读取 CSV 文件的命令:
df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)
是否有解决此问题的方法(例如,忽略与此问题相关的行)?我猜的一种方法是使用 csv 库删除该行(或用其他东西替换 "),但我想保持简单并在 pandas.
内尽可能多地做
Python版本:3.6.2
Pandas版本:0.21.0
谢谢你和最好的问候
只想指出@user8505495 的建议有效(再次感谢您)。
基本上只是将参数 quoting=3
添加到 read_csv
。在 to_csv
中使用相同的参数会导致错误(缺少转义字符)。一种选择是设置 escapechar
参数,或者不使用 quoting
参数。
我遇到了 pandas read_csv 的问题。我有一个文件,其中包含 " 作为字段值。实际上,情况并非如此,但我对文件生成没有影响,因此我必须找到解决方法。
pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 15345
我在 Git (link here) 上发现了一个问题报告,他们建议使用用于 "sep" 参数的定界符,也用于 "quotechar"。在这种情况下,文件结构会变得混乱。
我做的另一件事是为此添加一个例外,它将 运行 为其余文件编码,但我将继续为该特定类型的文件遇到这个问题。
我用来读取 CSV 文件的命令:
df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)
是否有解决此问题的方法(例如,忽略与此问题相关的行)?我猜的一种方法是使用 csv 库删除该行(或用其他东西替换 "),但我想保持简单并在 pandas.
内尽可能多地做Python版本:3.6.2
Pandas版本:0.21.0
谢谢你和最好的问候
只想指出@user8505495 的建议有效(再次感谢您)。
基本上只是将参数 quoting=3
添加到 read_csv
。在 to_csv
中使用相同的参数会导致错误(缺少转义字符)。一种选择是设置 escapechar
参数,或者不使用 quoting
参数。