如何解释相关图中的多重共线性?

How to interpret multicollinearity in a correlation plot?

我在 R 中为我的数据集创建了一个相关图,但我不确定如何选择以下哪对变量表示多重共线性?带有示例的解释将非常有帮助!

也许一种方法是通过 qgraph。首先,我将从 lavaan 包中加载 Holzinger 数据,从 correlation 包中加载相关函数,并使用 qgraph 包中的 qgraph 函数和以下库:

library(correlation)
library(qgraph)
library(lavaan)

根据 Holzinger 数据创建相关矩阵:

cor_holz <- HolzingerSwineford1939 %>% 
  correlation()

然后把所有的相关性做成qgraph。较粗的线表示相关性更强,绿色表示正,红色表示负。例如,您可以在此图中看到 x4-x6 在粗绿色三角形中高度相关:

qgraph(cor_holz)

这使得:

您可以通过为相关值建立截止值(如果您想查明哪些相关性最强,这很有用)、添加标题并更改维度来使它更有趣:

qgraph(cor_holz, # correlation 
       cut=.30, # cutoff value for correlations
       details = T, # shows details
       mar = c(6,10,6,10), # size of graph
       vsize = 8, # size of nodes
       title = "Q Graph of All Correlations") # title

一个更明确的例子是在同一个 lavaan 包中的 FacialBurns 数据,它显示了更明显的多重共线性,并且在各个变量中缺乏多重共线性:

face_cor <- FacialBurns %>% 
  correlation()

qgraph(face_cor)