Excel 导入的数据框列 header 名称替换

Excel imported dataframe column header name replacement

我导入了一个 excel table 和原来的列名。

MAS 183 /1095 OS (NV)
123 456

出现的列名在其中一个的空格处有一个额外的 \n,在两个的后面都有一个“.1”。

MAS 183 /1095.1 OS\n(NV).1
123 456
df.columns = df.columns.str.replace("\n", " ")
df.columns = df.columns.str.replace(".1", "")

使用上述命令对 header 列进行了字符串替换,结果对于带有数字的列名很奇怪。所有文本列名称似乎都可以。

MAS83 095 OS (NV)
123 456

IIUC,你想让列名和原来的一样吗?那你可以试试:

df.columns = df.columns.str.replace("\n", " ", regex=False).str.split('.').str[0]

输出:

   MAS 183 /1095  OS (NV)
0            123      456