如何使 Boxplot 更清晰、可读和易懂?

How to make Boxplot more clear, readable and understandable?

我有一个 World Covid 数据 csv 文件,其中包含 227 行(国家/地区)和 14 列(属性如“总病例、死亡、康复、活跃病例、测试...”)

我正在尝试在 Jupyter 中创建一个箱线图,但它并没有让我清楚地了解输出。 下面是我正在尝试的代码 -

#一张图上的多个箱线图 #设置样式

*sns.set(样式='whitegrid')

无花果,斧头 = plt.subplots(figsize=(10,10))

g = sns.boxplot(数据=df, 宽度=0.7)

plt.show()*

Output_1

我尝试了另一种非常基本的方法 - 它比以前的方法更糟糕。

df.plot(kind='box', vert=False);

Output_2

请帮忙:|

我认为你的问题是情节的规模。您目前看到您对大多数列的观察结果被挤在一起以容纳异常值。您可以做几件事:

  1. 使用值的对数,这样尺度就不会相距那么远。
  2. 您也可以将列拆分为单独的箱形图,以分别对其进行分析。

“清晰度”的定义也很重要。清晰度是什么意思?