为 Pandas 广播操作指定一个索引
Specifying an index for Pandas broadcasting operation
我有一个 Pandas 数据框,我想对其应用条件,并在另一个数据框上使用生成的索引。举个简单的例子:
a = pd.DataFrame(np.array([[1, 1, 2], [1, 2, 2], [2, 2, 1]]), columns=['a', 'b', 'c'])
a b c
0 1 1 2
1 1 2 2
2 2 2 1
b = pd.Series([111, 222, 333], index=['a', 'b', 'c'])
a 111
b 222
c 333
在此示例中,我想创建第三个数组,其维度与 'a' 相同,值为 1(或 True),其中 a == 2:
a b c
0 0 0 333
1 0 222 333
2 111 222 0
我的问题是,如何执行这样的操作并指定一个轴?我怀疑解决方案是以某种方式使用 pd.where,尽管我不想保留任何原始值。
IIUC
a.eq(2).mul(b,axis=1)
Out[803]:
a b c
0 0 0 333
1 0 222 333
2 111 222 0
正如你所说 pd.where
a.mask(a==1,0).mask(a==2,b,axis=1)
Out[834]:
a b c
0 0 0 333
1 0 222 333
2 111 222 0
我有一个 Pandas 数据框,我想对其应用条件,并在另一个数据框上使用生成的索引。举个简单的例子:
a = pd.DataFrame(np.array([[1, 1, 2], [1, 2, 2], [2, 2, 1]]), columns=['a', 'b', 'c'])
a b c
0 1 1 2
1 1 2 2
2 2 2 1
b = pd.Series([111, 222, 333], index=['a', 'b', 'c'])
a 111
b 222
c 333
在此示例中,我想创建第三个数组,其维度与 'a' 相同,值为 1(或 True),其中 a == 2:
a b c
0 0 0 333
1 0 222 333
2 111 222 0
我的问题是,如何执行这样的操作并指定一个轴?我怀疑解决方案是以某种方式使用 pd.where,尽管我不想保留任何原始值。
IIUC
a.eq(2).mul(b,axis=1)
Out[803]:
a b c
0 0 0 333
1 0 222 333
2 111 222 0
正如你所说 pd.where
a.mask(a==1,0).mask(a==2,b,axis=1)
Out[834]:
a b c
0 0 0 333
1 0 222 333
2 111 222 0