如何使用 matplotlib 中的分类数据创建饼图?
How do I create a pie chart using categorical data in matplotlib?
我有如下数据:
ID Gender Country ...
1 Male UK
2 Female US
3 Male NZ
4 Female UK
...
只有 2 个性别选项和 3 个国家选项。我想为“性别”和“国家/地区”创建一个单独的饼图,以显示每个选项在数据中出现的次数,但我对如何操作感到很困惑。
数据存储在 pandas 数据框中。
非常感谢任何帮助!
这是一种使用 pandas 的方法:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
def label_function(val):
return f'{val / 100 * len(df):.0f}\n{val:.0f}%'
N = 50
df = pd.DataFrame({'country': np.random.choice(['UK', 'US', 'NZ'], N),
'gender': np.random.choice(['Male', 'Female'], N)})
fig, (ax1, ax2) = plt.subplots(ncols=2, figsize=(10, 5))
df.groupby('country').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
colors=['tomato', 'gold', 'skyblue'], ax=ax1)
df.groupby('gender').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
colors=['violet', 'lime'], ax=ax2)
ax1.set_ylabel('Per country', size=22)
ax2.set_ylabel('Per gender', size=22)plt.tight_layout()
plt.show()
PS:要仅显示百分比,请使用 autopct='%1.0f%%'
。
好的,既然您使用的是这样的数据框:
data = pd.DataFrame([[1,'Male','UK'], [2, 'Female', 'NZ'], [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID', 'Gender', 'Country'])
你真的可以这样做:
data['Gender'].value_counts().plot(kind='pie')
如果您想手动操作:
people = len(data.Gender)
genders = len(set(data.Gender))
res = []
for gender in set(data.Gender):
res.append([gender, len(data[data['Gender']==gender]), len(data[data['Gender']==gender])/people])
然后绘制它。
我假设你是从这个开始的
import pandas as pd
from matplotlib.pyplot import pie, axis, show
df = pd.DataFrame([[1,'Male','UK'], [2, 'Female', 'NZ'], [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID', 'Gender', 'Country'])
性别情节
df.groupby('gender').size().plot(kind='pie', autopct='%.2f')
国家/地区绘图
df.groupby('country').size().plot(kind='pie', autopct='%.2f')
我有如下数据:
ID Gender Country ...
1 Male UK
2 Female US
3 Male NZ
4 Female UK
...
只有 2 个性别选项和 3 个国家选项。我想为“性别”和“国家/地区”创建一个单独的饼图,以显示每个选项在数据中出现的次数,但我对如何操作感到很困惑。
数据存储在 pandas 数据框中。
非常感谢任何帮助!
这是一种使用 pandas 的方法:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
def label_function(val):
return f'{val / 100 * len(df):.0f}\n{val:.0f}%'
N = 50
df = pd.DataFrame({'country': np.random.choice(['UK', 'US', 'NZ'], N),
'gender': np.random.choice(['Male', 'Female'], N)})
fig, (ax1, ax2) = plt.subplots(ncols=2, figsize=(10, 5))
df.groupby('country').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
colors=['tomato', 'gold', 'skyblue'], ax=ax1)
df.groupby('gender').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
colors=['violet', 'lime'], ax=ax2)
ax1.set_ylabel('Per country', size=22)
ax2.set_ylabel('Per gender', size=22)plt.tight_layout()
plt.show()
PS:要仅显示百分比,请使用 autopct='%1.0f%%'
。
好的,既然您使用的是这样的数据框:
data = pd.DataFrame([[1,'Male','UK'], [2, 'Female', 'NZ'], [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID', 'Gender', 'Country'])
你真的可以这样做:
data['Gender'].value_counts().plot(kind='pie')
如果您想手动操作:
people = len(data.Gender)
genders = len(set(data.Gender))
res = []
for gender in set(data.Gender):
res.append([gender, len(data[data['Gender']==gender]), len(data[data['Gender']==gender])/people])
然后绘制它。
我假设你是从这个开始的
import pandas as pd
from matplotlib.pyplot import pie, axis, show
df = pd.DataFrame([[1,'Male','UK'], [2, 'Female', 'NZ'], [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID', 'Gender', 'Country'])
性别情节
df.groupby('gender').size().plot(kind='pie', autopct='%.2f')
国家/地区绘图
df.groupby('country').size().plot(kind='pie', autopct='%.2f')