避免在 read_csv 中读取多索引

Avoiding multindex read in read_csv

我正在尝试读取 csv,它似乎在特定行中有问题。

我正在尝试探索这个问题,因为我得到了错误

Error tokenizing data. C error: Expected 23 fields in line 27, saw 37

这是我的发现:

前26行读取正常:

zero=pd.read_csv(basepath/nome, low_memory=False, dtype=str, delimiter=";", nrows=25)

但在第 26 行,该函数采用多索引数据帧,即使数据库没有多索引。

zero=pd.read_csv(basepath/nome, low_memory=False, dtype=str, delimiter=";", skiprows=25)

即使强制索引为 None (index_col=None),结果也是一个多索引 table(table 显示为索引的前 9 列)...

如何避免这种情况并正确读取 csv?

Error tokenizing data. C error: Expected 23 fields in line 27, saw 37

很可能该行的某些字段内有分隔符。

确保这些字段被引用并且 quotechar='"'


处理字段中包含的引号,例如:

"L.E.P. DI PIROZZI CARMINE S.A.S.\"";;;;;;;; "08020650019";

escapechar='\'可以用