避免在 read_csv 中读取多索引

Question

我正在尝试读取 csv，它似乎在特定行中有问题。

我正在尝试探索这个问题，因为我得到了错误

Error tokenizing data. C error: Expected 23 fields in line 27, saw 37

这是我的发现：

前26行读取正常：

zero=pd.read_csv(basepath/nome, low_memory=False, dtype=str, delimiter=";", nrows=25)

但在第 26 行，该函数采用多索引数据帧，即使数据库没有多索引。

zero=pd.read_csv(basepath/nome, low_memory=False, dtype=str, delimiter=";", skiprows=25)

即使强制索引为 None (index_col=None)，结果也是一个多索引 table（table 显示为索引的前 9 列)...

如何避免这种情况并正确读取 csv？

Answer 1

Error tokenizing data. C error: Expected 23 fields in line 27, saw 37

很可能该行的某些字段内有分隔符。

确保这些字段被引用并且 quotechar='"'。

处理字段中包含的引号，例如：

"L.E.P. DI PIROZZI CARMINE S.A.S.\"";;;;;;;; "08020650019";

escapechar='\'可以用

Avoiding multindex read in read_csv