如何使 Boxplot 更清晰、可读和易懂?
How to make Boxplot more clear, readable and understandable?
我有一个 World Covid 数据 csv 文件,其中包含 227 行(国家/地区)和 14 列(属性如“总病例、死亡、康复、活跃病例、测试...”)
我正在尝试在 Jupyter 中创建一个箱线图,但它并没有让我清楚地了解输出。
下面是我正在尝试的代码 -
#一张图上的多个箱线图
#设置样式
*sns.set(样式='whitegrid')
无花果,斧头 = plt.subplots(figsize=(10,10))
g = sns.boxplot(数据=df, 宽度=0.7)
plt.show()*
Output_1
我尝试了另一种非常基本的方法 - 它比以前的方法更糟糕。
df.plot(kind='box', vert=False);
Output_2
请帮忙:|
我认为你的问题是情节的规模。您目前看到您对大多数列的观察结果被挤在一起以容纳异常值。您可以做几件事:
- 使用值的对数,这样尺度就不会相距那么远。
- 您也可以将列拆分为单独的箱形图,以分别对其进行分析。
“清晰度”的定义也很重要。清晰度是什么意思?
我有一个 World Covid 数据 csv 文件,其中包含 227 行(国家/地区)和 14 列(属性如“总病例、死亡、康复、活跃病例、测试...”)
我正在尝试在 Jupyter 中创建一个箱线图,但它并没有让我清楚地了解输出。 下面是我正在尝试的代码 -
#一张图上的多个箱线图 #设置样式
*sns.set(样式='whitegrid')
无花果,斧头 = plt.subplots(figsize=(10,10))
g = sns.boxplot(数据=df, 宽度=0.7)
plt.show()*
Output_1
我尝试了另一种非常基本的方法 - 它比以前的方法更糟糕。
df.plot(kind='box', vert=False);
Output_2
请帮忙:|
我认为你的问题是情节的规模。您目前看到您对大多数列的观察结果被挤在一起以容纳异常值。您可以做几件事:
- 使用值的对数,这样尺度就不会相距那么远。
- 您也可以将列拆分为单独的箱形图,以分别对其进行分析。
“清晰度”的定义也很重要。清晰度是什么意思?