每个 pandas DataFrame 直方图子图的计数、条形图、分箱

Counts, bars, bins for each pandas DataFrame histogram subplot

我正在制作每个出发小时的旅行距离的单独直方图。但是,为了进行进一步的计算,对于所有直方图,我希望在直方图中获得每个 bin 的值。

到目前为止,我有以下内容:

    df['Distance'].hist(by=df['Departuretime'], color = 'red', 
            edgecolor = 'black',figsize=(15,15),sharex=True,density=True)

在我的例子中,这创建了一个包含 21 个小直方图的图形。

对于单个直方图,我会在整行前面粘贴 counts, bins, bars = ,变量 counts 将包含我要查找的数据,但是,在这种情况下它不起作用.

理想情况下,我想要每个直方图的数据框或某种列表,其中包含 bin 的密度值。我希望有人能帮助我!提前致谢!

编辑:

Data I'm using, about 2500 columns of this, Distance is float64, the Departuretime is str

Histogram output I'm receiving

在所有这些直方图中,我想知道每个条形图的 y 轴值,最好是在数据框中,距离分箱为行,小时数为列

通过使用 'cut' 函数,您可以直接从数据框中提取请求的数据,而不是从图表中提取。这少了error-sensitive.

df['DistanceBin'] = pd.cut(df['Distance'], bins=10)

然后,您可以使用 pivot_table 获得一个 table,其中 DistanceBin 和 Departuretime 的每个组合的计数分别作为您要求的行和列。

df.pivot_table(index='DistanceBin', columns='Departuretime', aggfunc='count')