每个 pandas DataFrame 直方图子图的计数、条形图、分箱

Question

我正在制作每个出发小时的旅行距离的单独直方图。但是，为了进行进一步的计算，对于所有直方图，我希望在直方图中获得每个 bin 的值。

到目前为止，我有以下内容：

    df['Distance'].hist(by=df['Departuretime'], color = 'red', 
            edgecolor = 'black',figsize=(15,15),sharex=True,density=True)

在我的例子中，这创建了一个包含 21 个小直方图的图形。

对于单个直方图，我会在整行前面粘贴 counts, bins, bars = ，变量 counts 将包含我要查找的数据，但是，在这种情况下它不起作用.

理想情况下，我想要每个直方图的数据框或某种列表，其中包含 bin 的密度值。我希望有人能帮助我！提前致谢！

编辑：

Data I'm using, about 2500 columns of this, Distance is float64, the Departuretime is str

Histogram output I'm receiving

在所有这些直方图中，我想知道每个条形图的 y 轴值，最好是在数据框中，距离分箱为行，小时数为列

Answer 1

通过使用 'cut' 函数，您可以直接从数据框中提取请求的数据，而不是从图表中提取。这少了error-sensitive.

df['DistanceBin'] = pd.cut(df['Distance'], bins=10)

然后，您可以使用 pivot_table 获得一个 table，其中 DistanceBin 和 Departuretime 的每个组合的计数分别作为您要求的行和列。

df.pivot_table(index='DistanceBin', columns='Departuretime', aggfunc='count')

Counts, bars, bins for each pandas DataFrame histogram subplot