如何仅可视化高相关性以更好地表示巨大的相关矩阵?
How to visualize only high correlations for better representation of the huge correlation matrix?
有没有一种方法可以在如下图所示的巨大相关矩阵中仅显示高相关性(如 correlations>=.9
)?
它会过滤一些标题,例如 (2,3,5,6,8,9,...),一种可能的解决方案是将特征尺寸缩小到重要的尺寸。
df = pd.read_csv('dataset.csv', sep=',')
sns.heatmap(df.corr())
plt.show()
您可以执行类似以下操作,其中 df.max(axis=1) > 0.90
正在按行检查是否至少有一个相关性超过 0.90,并且列的轴 = 0。
import pandas as pd
import matplotlib.pyplot as plt
import random
import numpy as np
import seaborn as sns
df = pd.DataFrame(np.random.random_sample((10,10)))
ndf = df.loc[df.max(axis=1) > 0.90, df.max(axis=0) > 0.90]
sns.heatmap(ndf)
plt.show()
有没有一种方法可以在如下图所示的巨大相关矩阵中仅显示高相关性(如 correlations>=.9
)?
它会过滤一些标题,例如 (2,3,5,6,8,9,...),一种可能的解决方案是将特征尺寸缩小到重要的尺寸。
df = pd.read_csv('dataset.csv', sep=',')
sns.heatmap(df.corr())
plt.show()
您可以执行类似以下操作,其中 df.max(axis=1) > 0.90
正在按行检查是否至少有一个相关性超过 0.90,并且列的轴 = 0。
import pandas as pd
import matplotlib.pyplot as plt
import random
import numpy as np
import seaborn as sns
df = pd.DataFrame(np.random.random_sample((10,10)))
ndf = df.loc[df.max(axis=1) > 0.90, df.max(axis=0) > 0.90]
sns.heatmap(ndf)
plt.show()