Excel 导入的数据框列 header 名称替换

Question

我导入了一个 excel table 和原来的列名。

MAS 183 /1095	OS (NV)
123	456

出现的列名在其中一个的空格处有一个额外的 \n，在两个的后面都有一个“.1”。

MAS 183 /1095.1	OS\n(NV).1
123	456

df.columns = df.columns.str.replace("\n", " ")
df.columns = df.columns.str.replace(".1", "")

使用上述命令对 header 列进行了字符串替换，结果对于带有数字的列名很奇怪。所有文本列名称似乎都可以。

MAS83 095	OS (NV)
123	456

Answer 1

IIUC，你想让列名和原来的一样吗？那你可以试试：

df.columns = df.columns.str.replace("\n", " ", regex=False).str.split('.').str[0]

输出：

   MAS 183 /1095  OS (NV)
0            123      456

Excel imported dataframe column header name replacement