python data.corr() 中的皮尔逊相关系数
Pearson correlation in python data.corr()
我有一个具有以下形状的矩阵 (20, 17)
,行是时间,列是变量的数量。
当我使用 data.corr()
计算相关矩阵时,自然会得到一个 (17 , 17)
矩阵。
我的问题:
有没有办法在 .corr()
函数中规范化变量 directly
? (我知道我可以事先做到这一点,然后再应用该功能)
我的相关矩阵很大,我无法一次查看所有内容(我必须向下滚动才能进行必要的比较)。有没有办法以简洁的方式(如热图)呈现结果,以便我可以轻松地从最低相关性中找出最高相关性?
非常感谢
您可以使用 matplotlib 的 imshow()
查看任何矩阵的热图。
此外,考虑使用 pandas 数据框,这样您可以按相关强度排序并保留每行和每列的标签。
我有一个具有以下形状的矩阵 (20, 17)
,行是时间,列是变量的数量。
当我使用 data.corr()
计算相关矩阵时,自然会得到一个 (17 , 17)
矩阵。
我的问题:
有没有办法在 .corr()
函数中规范化变量 directly
? (我知道我可以事先做到这一点,然后再应用该功能)
我的相关矩阵很大,我无法一次查看所有内容(我必须向下滚动才能进行必要的比较)。有没有办法以简洁的方式(如热图)呈现结果,以便我可以轻松地从最低相关性中找出最高相关性?
非常感谢
您可以使用 matplotlib 的 imshow()
查看任何矩阵的热图。
此外,考虑使用 pandas 数据框,这样您可以按相关强度排序并保留每行和每列的标签。