在循环内重新索引数据框

Reindex dataframe inside loop

我正在尝试重新索引循环内一组数据框中的列。这似乎只在循环之外起作用。请参阅下面的示例代码

import pandas as pd

data1 = [[1,2,3],[4,5,6],[7,8,9]]
data2 = [[10,11,12],[13,14,15],[16,17,18]]
data3 = [[19,20,21],[22,23,24],[25,26,27]]
index = ['a','b','c']
columns = ['d','e','f']

df1 = pd.DataFrame(data=data1,index=index,columns=columns)
df2 = pd.DataFrame(data=data2,index=index,columns=columns)
df3 = pd.DataFrame(data=data3,index=index,columns=columns)

columns2 = ['f','e','d']

for i in [df1,df2,df3]:
    i = i.reindex(columns=columns2)

print(df1)

df2 = df2.reindex(columns=columns2)

print(df2)

df1 没有按需要重新索引,但是如果我在循环之外重新索引 df2 它就可以工作。这是为什么?

谢谢 安德鲁

发生这种情况的原因与发生这种情况的原因相同:

a = 5
b = 6
for i in [a, b]:
    i = 4

>>> a
    5

为什么?参见 this accepted answer

关于您的问题,一种解决方法是创建一个 list 重新索引的数据帧,如下所示:

reindexed_dfs = [df.reindex(columns=columns2) for df in [df1, df2, df3]]

然后重新分配 df1df2df3。但最好还是继续使用新创建的列表。