Python Pandas read_csv 引用问题,无法分离数据
Python Pandas read_csv quote issue, impossible to separate data
我正在使用 Pandas 处理多个 csv。我更改了原始 csv 文件上的一些数据名称并保存了文件。然后,我重新启动并重新加载了我的 jupyter notebook,但现在我对所有数据框都得到了这样的东西,我向数据源收费:
Department Zone Element Product Year Unit Value
0 U1,"Z3","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
1 U1,"Z3","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
2 U1,"Z5","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
3 U1,"Z6","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
4 U1,"Z9","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
我尝试使用 sep=',', encoding='UTF-8-SIG',quotechar='"', quoting=0, engine='python'
但同样的问题。我不知道如何解析 csv,因为即使我从数据中创建了一个新的 csv(没有引号和分隔符 ;),同样的问题出现了...
csv 为 321 行,如本例问题:https://www.cjoint.com/c/LDCmfvq06R6
和 Pandas 中没有问题的原始 csv 文件:https://www.cjoint.com/c/LDCmlweuR66
我觉得文件的引号有问题
import csv
df = pd.read_csv('LDCmfvq06R6_FAOSTAT.csv', quotechar='"',
delimiter = ',',
quoting=csv.QUOTE_NONE,
on_bad_lines='skip')
for i, col in enumerate(df.columns):
df.iloc[:, i] = df.iloc[:, i].str.replace('"', '')
df.head()
我正在使用 Pandas 处理多个 csv。我更改了原始 csv 文件上的一些数据名称并保存了文件。然后,我重新启动并重新加载了我的 jupyter notebook,但现在我对所有数据框都得到了这样的东西,我向数据源收费:
Department Zone Element Product Year Unit Value
0 U1,"Z3","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
1 U1,"Z3","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
2 U1,"Z5","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
3 U1,"Z6","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
4 U1,"Z9","ODD 2.a.1... NaN NaN NaN NaN NaN NaN
我尝试使用 sep=',', encoding='UTF-8-SIG',quotechar='"', quoting=0, engine='python'
但同样的问题。我不知道如何解析 csv,因为即使我从数据中创建了一个新的 csv(没有引号和分隔符 ;),同样的问题出现了...
csv 为 321 行,如本例问题:https://www.cjoint.com/c/LDCmfvq06R6 和 Pandas 中没有问题的原始 csv 文件:https://www.cjoint.com/c/LDCmlweuR66
我觉得文件的引号有问题
import csv
df = pd.read_csv('LDCmfvq06R6_FAOSTAT.csv', quotechar='"',
delimiter = ',',
quoting=csv.QUOTE_NONE,
on_bad_lines='skip')
for i, col in enumerate(df.columns):
df.iloc[:, i] = df.iloc[:, i].str.replace('"', '')
df.head()