允许 python 在 python 中导入具有重复列名的 csv
allowing python to impoert csv with duplicate column names in python
我有一个如下所示的数据框:
共有109列。
当我使用 read_csv 导入数据时,它会将“.1”、“.2”添加到重复名称中。
有什么办法可以解决吗?
我已经试过了:
df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding = "ISO-8859-1",
sep='|', header=None)
df = df.rename(columns=df.iloc[0], copy=False).iloc[1:].reset_index(drop=True)
但它更改了数据框并且没有帮助。
这就是它对我的数据所做的
python:
excel:
删除header=None
,因为它用于避免将文件的第一行转换为df.columns
,然后从列名称中删除带有数字的.
:
df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding="ISO-8859-1", sep=',')
df.columns = df.columns.str.replace('\.\d+$','')
我有一个如下所示的数据框:
共有109列。 当我使用 read_csv 导入数据时,它会将“.1”、“.2”添加到重复名称中。 有什么办法可以解决吗?
我已经试过了:
df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding = "ISO-8859-1",
sep='|', header=None)
df = df.rename(columns=df.iloc[0], copy=False).iloc[1:].reset_index(drop=True)
但它更改了数据框并且没有帮助。 这就是它对我的数据所做的 python:
excel:
删除header=None
,因为它用于避免将文件的第一行转换为df.columns
,然后从列名称中删除带有数字的.
:
df = pd.read_csv(r'C:\Users\agns1\Downloads\treatment1.csv',encoding="ISO-8859-1", sep=',')
df.columns = df.columns.str.replace('\.\d+$','')