r 协方差矩阵和相关矩阵

r covariance matrix and correlation matrix

您好,我正在使用包 ipred 中的数据营养不良。 我使用了一个子集来与运营商和正常人分开:

carrier = subset(dystrophy,dystrophy$Class == "carrier")
normal = subset(dystrophy,dystrophy$Class == "normal")

我已经减少了这些数据,只选择了在医院就诊 1 次的患者:

carrier = subset(carrier,carrier$OBS == "1")
normal = subset(normal,normal$OBS == "1")

所以现在我想练习计算蛋白质的均值向量、协方差矩阵和相关矩阵,但要按不同的组(Class 因子)进行计算。

我试过使用 cor 和 cov,但我认为我做错了什么。任何帮助,将不胜感激。谢谢!!

这可能会让您入门。使用您的变量,您可以使用以下方法获得每种蛋白质的方法:

sapply(carrier[,6:9], mean, na.rm=T)
sapply(normal[,6:9], mean, na.rm=T)

对于相关性和协方差,您可以使用:

cor(carrier[,6:9], use="pairwise.complete.obs")
cor(normal[,6:9], use="pairwise.complete.obs")

cov(carrier[,6:9], use="pairwise.complete.obs")
cov(normal[,6:9], use="pairwise.complete.obs")

6:9 部分用于限制对蛋白质的计算,不包括年龄等其他特征。 use="pairwise.complete.obs" 部分用于处理缺失值。