Python 中的分档数据

Binning data in Python

我正在努力了解如何在 Python 中对数据进行分类。到目前为止,我已经弄清楚如何使用以下方法获得边缘:

edges = pylab.hist(data, bins=10)[1]

我不确定这是否是最理想的方法,但它奏效了!给我一份制作 10 个箱子所需的 11 个数字的列表。问题是我不知道如何将数据分类到垃圾箱中。我尝试使用:

digitized = np.digitize(data, edges)

但这只是给了我一个错误,“ValueError:零大小数组到最小化操作没有标识”。在使用 pandas value_counts 之前,我需要以某种方式制作垃圾箱(我也已经放下了那部分)。

如有任何帮助,我们将不胜感激!

答案是:

digitized = np.digitize(data, edges)