减少 python 中的空垃圾箱
Reduce empty bins in python
我是 python 分箱的新手,我正在尝试创建具有 属性 价格的分箱。我希望我的最后一个垃圾箱是 4000000 + 以减少空垃圾箱。
这是我的代码:
bins = np.arange(0, 13000000, 1000000)
print(bins)
labels = pd.cut(data['PRICE'], bins, right= True)
labels = labels.value_counts().sort_index()
labels
输出是
(0, 1000000] 869
(1000000, 2000000] 88
(2000000, 3000000] 20
(3000000, 4000000] 4
(4000000, 5000000] 1
(5000000, 6000000] 1
(6000000, 7000000] 0
(7000000, 8000000] 0
(8000000, 9000000] 0
(9000000, 10000000] 0
(10000000, 11000000] 0
(11000000, 12000000] 1
如何将 bins 减少到 4000000 或更多,使频率为 3?
这应该可以在这里工作,您必须手动设置 bin 边界:
bins = [1000000,2000000,3000000,4000000,12000000]
print(bins)
labels = pd.cut(data['PRICE'], bins, right= True)
labels = labels.value_counts().sort_index()
labels
此外,请在此处查看有关该主题的不同答案:
我是 python 分箱的新手,我正在尝试创建具有 属性 价格的分箱。我希望我的最后一个垃圾箱是 4000000 + 以减少空垃圾箱。
这是我的代码:
bins = np.arange(0, 13000000, 1000000)
print(bins)
labels = pd.cut(data['PRICE'], bins, right= True)
labels = labels.value_counts().sort_index()
labels
输出是
(0, 1000000] 869
(1000000, 2000000] 88
(2000000, 3000000] 20
(3000000, 4000000] 4
(4000000, 5000000] 1
(5000000, 6000000] 1
(6000000, 7000000] 0
(7000000, 8000000] 0
(8000000, 9000000] 0
(9000000, 10000000] 0
(10000000, 11000000] 0
(11000000, 12000000] 1
如何将 bins 减少到 4000000 或更多,使频率为 3?
这应该可以在这里工作,您必须手动设置 bin 边界:
bins = [1000000,2000000,3000000,4000000,12000000]
print(bins)
labels = pd.cut(data['PRICE'], bins, right= True)
labels = labels.value_counts().sort_index()
labels
此外,请在此处查看有关该主题的不同答案: