在 Python 如何 re-organise 与 Excel 不一致的列?
In Python How Do I re-organise inconsistent columns from Excel?
我有一堆报告,都包含相同的信息,但列的顺序和标题不一致,所以当我 运行 解析信息的函数时,我没有得到我想要的想。
如何使用 python 以一致的方式组织列以供以后使用?
目前的列看起来像;
['Comment', 'Rec Date', 'Receipt Number', 'Rec Amt', 'Receipt Method', 'Status']
['Comment', 'State', 'Rec No', 'Rec Date', 'Rec Amt', 'Status']
['Receipt Number', 'Rec Date', 'Rec Amt', 'Comment', 'State', 'Status']
['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method']
['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'Receipt Method', 'State']
['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method']
我希望所有这些类别都包含在列中。 (没有特定列值的点将获得一些占位符或空值。)
第一个 read_excel
为 DataFrame
:
df = pd.read_excel('file.xlsx')
我相信你需要 rename
列,然后按 sort_index
:
排序
d = {'Rec No':'Receipt Number', 'Rec Method':'Receipt Method',...}
df = df.rename(columns=d).sort_index(axis=1)
我有一堆报告,都包含相同的信息,但列的顺序和标题不一致,所以当我 运行 解析信息的函数时,我没有得到我想要的想。
如何使用 python 以一致的方式组织列以供以后使用?
目前的列看起来像;
['Comment', 'Rec Date', 'Receipt Number', 'Rec Amt', 'Receipt Method', 'Status']
['Comment', 'State', 'Rec No', 'Rec Date', 'Rec Amt', 'Status']
['Receipt Number', 'Rec Date', 'Rec Amt', 'Comment', 'State', 'Status']
['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method']
['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'Receipt Method', 'State']
['Comment', 'Receipt Number', 'Rec Date', 'Rec Amt', 'State', 'Rec Method']
我希望所有这些类别都包含在列中。 (没有特定列值的点将获得一些占位符或空值。)
第一个 read_excel
为 DataFrame
:
df = pd.read_excel('file.xlsx')
我相信你需要 rename
列,然后按 sort_index
:
d = {'Rec No':'Receipt Number', 'Rec Method':'Receipt Method',...}
df = df.rename(columns=d).sort_index(axis=1)