每个 pandas DataFrame 直方图子图的计数、条形图、分箱
Counts, bars, bins for each pandas DataFrame histogram subplot
我正在制作每个出发小时的旅行距离的单独直方图。但是,为了进行进一步的计算,对于所有直方图,我希望在直方图中获得每个 bin 的值。
到目前为止,我有以下内容:
df['Distance'].hist(by=df['Departuretime'], color = 'red',
edgecolor = 'black',figsize=(15,15),sharex=True,density=True)
在我的例子中,这创建了一个包含 21 个小直方图的图形。
对于单个直方图,我会在整行前面粘贴 counts, bins, bars =
,变量 counts
将包含我要查找的数据,但是,在这种情况下它不起作用.
理想情况下,我想要每个直方图的数据框或某种列表,其中包含 bin 的密度值。我希望有人能帮助我!提前致谢!
编辑:
Data I'm using, about 2500 columns of this, Distance is float64, the Departuretime is str
Histogram output I'm receiving
在所有这些直方图中,我想知道每个条形图的 y 轴值,最好是在数据框中,距离分箱为行,小时数为列
通过使用 'cut' 函数,您可以直接从数据框中提取请求的数据,而不是从图表中提取。这少了error-sensitive.
df['DistanceBin'] = pd.cut(df['Distance'], bins=10)
然后,您可以使用 pivot_table 获得一个 table,其中 DistanceBin 和 Departuretime 的每个组合的计数分别作为您要求的行和列。
df.pivot_table(index='DistanceBin', columns='Departuretime', aggfunc='count')
我正在制作每个出发小时的旅行距离的单独直方图。但是,为了进行进一步的计算,对于所有直方图,我希望在直方图中获得每个 bin 的值。
到目前为止,我有以下内容:
df['Distance'].hist(by=df['Departuretime'], color = 'red',
edgecolor = 'black',figsize=(15,15),sharex=True,density=True)
在我的例子中,这创建了一个包含 21 个小直方图的图形。
对于单个直方图,我会在整行前面粘贴 counts, bins, bars =
,变量 counts
将包含我要查找的数据,但是,在这种情况下它不起作用.
理想情况下,我想要每个直方图的数据框或某种列表,其中包含 bin 的密度值。我希望有人能帮助我!提前致谢!
编辑:
Data I'm using, about 2500 columns of this, Distance is float64, the Departuretime is str
Histogram output I'm receiving
在所有这些直方图中,我想知道每个条形图的 y 轴值,最好是在数据框中,距离分箱为行,小时数为列
通过使用 'cut' 函数,您可以直接从数据框中提取请求的数据,而不是从图表中提取。这少了error-sensitive.
df['DistanceBin'] = pd.cut(df['Distance'], bins=10)
然后,您可以使用 pivot_table 获得一个 table,其中 DistanceBin 和 Departuretime 的每个组合的计数分别作为您要求的行和列。
df.pivot_table(index='DistanceBin', columns='Departuretime', aggfunc='count')