如何绘制 pandas 计数的分组条形图
How to plot a grouped bar plot of count from pandas
我有一个包含以下列的数据框:
gender class
male A
female A
male B
female B
male B
female A
我想绘制一个双条形图,其中的列代表每个性别,值代表每个性别分别在 class A 和 B 中的数量。
所以条形图应该按性别分组,应该有 2 个条形图 - 每个 class。
我如何将其可视化?我看到这个例子,但我真的很困惑
speed = [0.1, 17.5, 40, 48, 52, 69, 88]
lifespan = [2, 8, 70, 1.5, 25, 12, 28]
index = ['snail', 'pig', 'elephant',
'rabbit', 'giraffe', 'coyote', 'horse']
df = pd.DataFrame({'speed': speed,
'lifespan': lifespan}, index=index)
speed lifespan
snail 0.1 2.0
pig 17.5 8.0
elephant 40.0 70.0
rabbit 48.0 1.5
giraffe 52.0 25.0
coyote 69.0 12.0
horse 88.0 28.0
ax = df.plot.bar(rot=0)
我的索引只是第 0 行到第 # 行,所以我很困惑如何配置 df.plot.bar
以处理我的用例。如有任何帮助,我们将不胜感激!
- 使用
pandas.DataFrame.pivot_table
to reshape the dataframe from a long to wide format. The index will be the x-axis, and the columns will be the groups when plotted with pandas.DataFrame.plot
pd.crosstab(df['gender'], df['class'])
也可用于聚合重塑。
- 或者,将
seaborn.countplot
and hue='class'
, or the figure level version seaborn.catplot
与 kind='count'
结合使用,两者都可以在不重塑数据帧的情况下创建所需的绘图。
- 如果所需列之一在索引中,请指定
df.index
或使用 df = df.reset_index()
重置索引
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = {'gender': ['male', 'female', 'male', 'female', 'male', 'female'], 'class': ['A', 'A', 'B', 'B', 'B', 'A']}
df = pd.DataFrame(data)
# pivot the data and aggregate
dfp = df.pivot_table(index='gender', columns='class', values='class', aggfunc='size')
# plot
dfp.plot(kind='bar', figsize=(5, 3), rot=0)
plt.show()
plt.figure(figsize=(5, 3))
sns.countplot(data=df, x='gender', hue='class')
plt.show()
sns.catplot(kind='count', data=df, x='gender', hue='class', height=3, aspect=1.4)
plt.show()
我有一个包含以下列的数据框:
gender class
male A
female A
male B
female B
male B
female A
我想绘制一个双条形图,其中的列代表每个性别,值代表每个性别分别在 class A 和 B 中的数量。
所以条形图应该按性别分组,应该有 2 个条形图 - 每个 class。
我如何将其可视化?我看到这个例子,但我真的很困惑
speed = [0.1, 17.5, 40, 48, 52, 69, 88]
lifespan = [2, 8, 70, 1.5, 25, 12, 28]
index = ['snail', 'pig', 'elephant',
'rabbit', 'giraffe', 'coyote', 'horse']
df = pd.DataFrame({'speed': speed,
'lifespan': lifespan}, index=index)
speed lifespan
snail 0.1 2.0
pig 17.5 8.0
elephant 40.0 70.0
rabbit 48.0 1.5
giraffe 52.0 25.0
coyote 69.0 12.0
horse 88.0 28.0
ax = df.plot.bar(rot=0)
我的索引只是第 0 行到第 # 行,所以我很困惑如何配置 df.plot.bar
以处理我的用例。如有任何帮助,我们将不胜感激!
- 使用
pandas.DataFrame.pivot_table
to reshape the dataframe from a long to wide format. The index will be the x-axis, and the columns will be the groups when plotted withpandas.DataFrame.plot
pd.crosstab(df['gender'], df['class'])
也可用于聚合重塑。
- 或者,将
seaborn.countplot
andhue='class'
, or the figure level versionseaborn.catplot
与kind='count'
结合使用,两者都可以在不重塑数据帧的情况下创建所需的绘图。 - 如果所需列之一在索引中,请指定
df.index
或使用df = df.reset_index()
重置索引
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = {'gender': ['male', 'female', 'male', 'female', 'male', 'female'], 'class': ['A', 'A', 'B', 'B', 'B', 'A']}
df = pd.DataFrame(data)
# pivot the data and aggregate
dfp = df.pivot_table(index='gender', columns='class', values='class', aggfunc='size')
# plot
dfp.plot(kind='bar', figsize=(5, 3), rot=0)
plt.show()
plt.figure(figsize=(5, 3))
sns.countplot(data=df, x='gender', hue='class')
plt.show()
sns.catplot(kind='count', data=df, x='gender', hue='class', height=3, aspect=1.4)
plt.show()