允许 python 在 python 中导入具有重复列名的 csv

Question

我有一个如下所示的数据框：

共有109列。当我使用 read_csv 导入数据时，它会将“.1”、“.2”添加到重复名称中。有什么办法可以解决吗？

我已经试过了：

  df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding = "ISO-8859-1", 
  sep='|', header=None)

  df = df.rename(columns=df.iloc[0], copy=False).iloc[1:].reset_index(drop=True)

但它更改了数据框并且没有帮助。这就是它对我的数据所做的 python:

excel:

Answer 1

删除header=None，因为它用于避免将文件的第一行转换为df.columns，然后从列名称中删除带有数字的.：

df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding="ISO-8859-1", sep=',')

df.columns = df.columns.str.replace('\.\d+$','')

允许 python 在 python 中导入具有重复列名的 csv

allowing python to impoert csv with duplicate column names in python

csv

duplicates

multiple-columns

dataframe

pandas