找出与响应最相关的 5 个变量
Find which 5 variables are most correlated with response
我有一个数据集“保险”,其中包含 22 个关于医疗支出数据的变量。我必须找到与变量最相关的 5 个变量:“totex”。
我试过 cor(insurance$totexp,insurance) 但它只是给了我相关性而没有对它们进行排序。然后我尝试了 sort(cor(insurance$totexp,insurance)) 它显示了排序的相关性但它没有显示变量的名称。
你知道最好的方法是什么吗?
提前致谢
cors <- cor(mtcars$mpg, mtcars)
cors[, order(cors[1, ])]
Returns:
wt cyl disp hp carb qsec gear am vs drat mpg
-0.8676594 -0.8521620 -0.8475514 -0.7761684 -0.5509251 0.4186840 0.4802848 0.5998324 0.6640389 0.6811719 1.0000000
我们可以使用
cors[, order(cors[1, ], decreasing = TRUE)]
对于降序...
我有一个数据集“保险”,其中包含 22 个关于医疗支出数据的变量。我必须找到与变量最相关的 5 个变量:“totex”。 我试过 cor(insurance$totexp,insurance) 但它只是给了我相关性而没有对它们进行排序。然后我尝试了 sort(cor(insurance$totexp,insurance)) 它显示了排序的相关性但它没有显示变量的名称。
你知道最好的方法是什么吗?
提前致谢
cors <- cor(mtcars$mpg, mtcars)
cors[, order(cors[1, ])]
Returns:
wt cyl disp hp carb qsec gear am vs drat mpg -0.8676594 -0.8521620 -0.8475514 -0.7761684 -0.5509251 0.4186840 0.4802848 0.5998324 0.6640389 0.6811719 1.0000000
我们可以使用
cors[, order(cors[1, ], decreasing = TRUE)]
对于降序...