如何可视化 Pandas 中的缺失值模式
How to visualize missing values patterns in Pandas
我知道有像 missingno
这样可视化缺失值的软件包。如何在不使用 Pandas 和 Matplotlib 的附加包的情况下可视化缺失值模式?我期待类似下图的内容,其中缺失数据为白色:
你可以使用 matplot 得到你需要的东西:
import pandas as pd
plt.rcParams["figure.figsize"] = (20, 10)
df = pd.read_excel("C:/Users/Jhonny/Desktop/titanic.xlsx")
plt.imshow(df.isnull(), cmap='hot', aspect='auto')
plt.show()
注意:我使用了来自 kaggle 的 titanic 数据的一个子集。
结果:
从索引 0 开始,此热图可视化立即告诉我们缺失值的分布方式(以及位置)。
我知道,我现在不太喜欢。
Matplot 需要做更多的工作才能将这个原始图形变成更好的东西。
但如果你想要更好更快的东西,我真的建议 seaborn
。
Seaborn
是一个Python数据可视化库,基于matplotlib。它提供了一个高级界面,用于绘制有吸引力且信息丰富的统计图形。
import seaborn as sns
sns.heatmap(df.isnull(), cbar=False)
plt.show()
我知道有像 missingno
这样可视化缺失值的软件包。如何在不使用 Pandas 和 Matplotlib 的附加包的情况下可视化缺失值模式?我期待类似下图的内容,其中缺失数据为白色:
你可以使用 matplot 得到你需要的东西:
import pandas as pd
plt.rcParams["figure.figsize"] = (20, 10)
df = pd.read_excel("C:/Users/Jhonny/Desktop/titanic.xlsx")
plt.imshow(df.isnull(), cmap='hot', aspect='auto')
plt.show()
注意:我使用了来自 kaggle 的 titanic 数据的一个子集。
结果:
从索引 0 开始,此热图可视化立即告诉我们缺失值的分布方式(以及位置)。
我知道,我现在不太喜欢。 Matplot 需要做更多的工作才能将这个原始图形变成更好的东西。
但如果你想要更好更快的东西,我真的建议 seaborn
。
Seaborn
是一个Python数据可视化库,基于matplotlib。它提供了一个高级界面,用于绘制有吸引力且信息丰富的统计图形。
import seaborn as sns
sns.heatmap(df.isnull(), cbar=False)
plt.show()