Pandas 按值 1 对列进行分组并按频率排序

Question

我必须使用这个数据框：

d = {'Apple': [0,0,1,0,1,0], 'Aurora': [0,0,0,0,0,1], 'Barn': [0,1,1,0,0,0]}
df = pd.DataFrame(data=d)

  Apple Aurora Barn
0   0   0   0
1   0   0   1
2   1   0   1
3   0   0   0
4   1   0   0
5   0   1   0

并计算每列中第一个出现的频率，并创建一个如下所示的新数据框：

df = pd.DataFrame([['Apple',0.3333], ['Aurora',0.166666], ['Barn', 0.3333]], columns = ['index', 'value'])

    index   value
0   Apple   0.333300
1   Aurora  0.166666
2   Barn    0.333300

我试过这个：

df['freq'] = df.groupby(1)[1].transform('count')

但是我得到一个错误：KeyError: 1

所以我不确定如何跨行和列计算值 1，以及如何按列名和每列中 1 的出现频率进行分组。

Answer 1

如果我没理解错的话，你可以简单的这样做：

freq = df.mean()

输出：

>>> freq
Apple     0.333333
Aurora    0.166667
Barn      0.333333
dtype: float64

Pandas 按值 1 对列进行分组并按频率排序

Pandas Group Columns by Value of 1 and Sort By Frequency

count

dataframe

pandas

pandas-groupby