将一个 Pandas 数据框除以另一个 - 忽略索引但尊重列

Question

我有 2 个数据框。我要广播除法运算

df1= pd.DataFrame([[1.,2.,3.,4.], [5.,6.,7.,8.], [9.,10.,11.,12.]],
                  columns=['A','B','C','D'], index=['x','y','z'])

df2= pd.DataFrame([[0.,1.,2.,3.]], columns=['A','B','D','C'], index=['q'])

请注意，列在 df2 中的对齐方式略有不同。

我想将 df1 除以 df2，其中行被广播但列标签被尊重。

   A   B   C   D
x  1   2   3   4
y  5   6   7   8
z  9  10  11  12


   A  B  D  C
q  0  1  2  3

这是错误的。

df1.values/df2.values

[[         inf   2.           1.5          1.33333333]
 [         inf   6.           3.5          2.66666667]
 [         inf  10.           5.5          4.        ]]

我想要的答案是：

   A    B   C      D
x  inf  2   1      2
y  inf  6   2.33   4
z  inf  10  3.66   6

Answer 1

可能是，您可以订购与 df1 相同的 df2 列，然后除以值

In [53]: df1.values/df2[df1.columns].values
Out[53]:
array([[         inf,   2.        ,   1.        ,   2.        ],
       [         inf,   6.        ,   2.33333333,   4.        ],
       [         inf,  10.        ,   3.66666667,   6.        ]])

Answer 2

您可以对列重新排序，然后调用 squeeze 来展平数组，然后调用 div:

In [114]:

df1= pd.DataFrame( [[1.,2.,3.,4.],[5.,6.,7.,8.],[9.,10.,11.,12.]] ,columns = ['A','B','C','D'], index = ['x','y','z'])
df2= pd.DataFrame( [[0.,1.,2.,3.]] ,columns = ['A','B','D','C'], index = ['q'])    
df1.div(df2.ix[:,df1.columns].squeeze())

Out[114]:
     A   B         C  D
x  inf   2  1.000000  2
y  inf   6  2.333333  4
z  inf  10  3.666667  6

df1/df2.ix[:,df1.columns].squeeze() 也有效，但@Joris 的回答更好

编辑

正如@joris 所指出的，列重新排序是不必要的，因为 pandas 无论如何都会自然地与列对齐，所以：

df1.div(df2squeeze())

或

df1./df2squeeze()

会起作用

Answer 3

如果您除以一个系列（通过选择第二个数据框的那一行），pandas 会将这个系列与第一个数据框的列对齐，给出所需的结果：

In [75]: df1 / df2.loc['q']
Out[75]:
     A   B         C  D
x  inf   2  1.000000  2
y  inf   6  2.333333  4
z  inf  10  3.666667  6

如果您不know/want使用那一行的名称，您可以使用squeeze将单列数据帧转换为一系列：df1 / df2.squeeze()（参见@EdChum 的回答）。

将一个 Pandas 数据框除以另一个 - 忽略索引但尊重列

Divide One Pandas Dataframe by Another - Ignore index but respect columns

python

divide

pandas