R中具有不同矩阵维度的典型相关

Question

我在 R 中进行 CC 分析时遇到困难。
我正在做的作业来自 Sharma 的“应用多元分析”，练习 13.7，如果你熟悉的话。

基本上，我被要求对一组变量进行 CCA。有七个 X 变量，但只有五个 Y 变量，因此 R 抱怨维度不兼容。请参见下图，了解名为 CETNEW.

的数据的可视化表示

已编辑（从图像更改为输出）：

structure(list(...  
1 = c("X1", "X2", "X3", "X4", "X5", "X6", "X7", "Y1", "Y2", "Y3", "Y4", "Y5"),
2 = c(2.72, 1.2, 0.82, 0.92, 1.19, 1, 1.45, 0.68, 0.98, 0.57, 1.07, 0.91), ...
3 = c(1.2, 3.78, 0.7, 1.04, 1.06, 1.32, 1.31, 0.56, 1, 0.79, 1.13, 1.38), ...    
4 = c(0.82, 0.7, 1.7, 0.59, 0.83, 1.08, 1.01, 0.65, 0.78, 0.66, 0.93, 0.77), ...  
5 = c(0.92, 1.04, 0.59, 3.09, 1.06, 0.93, 1.47, 0.62, 1.26, 0.51, 0.94, 0.85), ...  
6 = c(1.19, 1.06, 0.83, 1.06, 2.94, 1.36, 1.66, 0.68, 1.16, 0.77, 1.37, 1.11), ...  
7 = c(1, 1.32, 1.08, 0.93, 1.36, 2.94, 1.56, 0.9, 1.23, 0.78, 1.65, 1.31), ...  
8 = c(1.45, 1.31, 1.01, 1.47, 1.66, 1.56, 3.11, 1.03, 1.7, 0.81, 1.63, 1.44), ...  
9 = c(0.68, 0.56, 0.65, 0.62, 0.68, 0.9, 1.03, 1.71, 0.99, 0.65, 0.86, 0.72), ...  
10 = c(0.98, 1, 0.78, 1.26, 1.16, 1.23, 1.7, 0.99, 3.07, 0.61, 1.43, 1.28), ...  
11 = c(0.57, 0.79, 0.66, 0.51, 0.77, 0.78, 0.81, 0.65, 0.61, 2.83, 1.04, 0.84), ...  
12 = c(1.07, 1.13, 0.93, 0.94, 1.37, 1.65, 1.63, 0.86, 1.43, 1.04, 2.83, 1.6), ...  
13 = c(0.91, 1.38, 0.77, 0.85, 1.11, 1.31, 1.44, 0.72, 1.28, 0.84, 1.6, 4.01)),   
row.names = c(NA, -12L), class = c("tbl_df", "tbl", "data.frame"))

到目前为止我做了什么

CETNEW <- CETNEW[,-1] #To remove the non-numeric values

创建两个变量（标准和预测变量）为：

CETNEWx <- CETNEW[1:7,]
CETNEWy <- CETNEW[8:12,]

然后我一直在使用各种软件包，例如 CCA、CCP 和 candisk。来自 CCA：

ccCETNEW <- cc(CETNEWx,CETNEWy)

产生以下错误消息：

Error in cov(X, Y, use = "pairwise") : incompatible dimensions

同样来自 CCA 的 matcor 函数产生以下错误消息：

Error in data.frame(..., check.names = FALSE) : arguments imply differing number of rows: 7, 5

如此看来，这一切似乎都归结为异维问题。我已经和我的教授谈过这个问题，但由于他使用的是 SAS，这显然与这个问题兼容并且可以解决它，他无法帮助我。

拜托，如果您熟悉典型相关并且之前遇到过类似的问题，非常感谢您提供有关此主题的任何帮助。

Answer 1

如果您查看数据，请注意第一列分为 X 和 Y 标签。这向我表明您的数据已转置。如果是这样，则每一列都是一个观察值，X 和 Y 标签表示对每个观察值进行的各种测量。对来自一组观察值的两组 measurements/variables 执行典型相关。首先，这里是转置数据：

CETNEW.T <- structure(list(X1 = c(2.72, 1.2, 0.82, 0.92, 1.19, 1, 1.45, 0.68, 
0.98, 0.57, 1.07, 0.91), X2 = c(1.2, 3.78, 0.7, 1.04, 1.06, 1.32, 
1.31, 0.56, 1, 0.79, 1.13, 1.38), X3 = c(0.82, 0.7, 1.7, 0.59, 
0.83, 1.08, 1.01, 0.65, 0.78, 0.66, 0.93, 0.77), X4 = c(0.92, 
1.04, 0.59, 3.09, 1.06, 0.93, 1.47, 0.62, 1.26, 0.51, 0.94, 0.85
), X5 = c(1.19, 1.06, 0.83, 1.06, 2.94, 1.36, 1.66, 0.68, 1.16, 
0.77, 1.37, 1.11), X6 = c(1, 1.32, 1.08, 0.93, 1.36, 2.94, 1.56, 
0.9, 1.23, 0.78, 1.65, 1.31), X7 = c(1.45, 1.31, 1.01, 1.47, 
1.66, 1.56, 3.11, 1.03, 1.7, 0.81, 1.63, 1.44), Y1 = c(0.68, 
0.56, 0.65, 0.62, 0.68, 0.9, 1.03, 1.71, 0.99, 0.65, 0.86, 0.72
), Y2 = c(0.98, 1, 0.78, 1.26, 1.16, 1.23, 1.7, 0.99, 3.07, 0.61, 
1.43, 1.28), Y3 = c(0.57, 0.79, 0.66, 0.51, 0.77, 0.78, 0.81, 
0.65, 0.61, 2.83, 1.04, 0.84), Y4 = c(1.07, 1.13, 0.93, 0.94, 
1.37, 1.65, 1.63, 0.86, 1.43, 1.04, 2.83, 1.6), Y5 = c(0.91, 
1.38, 0.77, 0.85, 1.11, 1.31, 1.44, 0.72, 1.28, 0.84, 1.6, 4.01
)), class = "data.frame", row.names = c(NA, -12L))

现在分析运行正常：

library("CCA")
str(CETNEW.T)
# 'data.frame': 12 obs. of  12 variables:
#  $ X1: num  2.72 1.2 0.82 0.92 1.19 1 1.45 0.68 0.98 0.57 ...
#  $ X2: num  1.2 3.78 0.7 1.04 1.06 1.32 1.31 0.56 1 0.79 ...
#  $ X3: num  0.82 0.7 1.7 0.59 0.83 1.08 1.01 0.65 0.78 0.66 ...
#  $ X4: num  0.92 1.04 0.59 3.09 1.06 0.93 1.47 0.62 1.26 0.51 ...
#  $ X5: num  1.19 1.06 0.83 1.06 2.94 1.36 1.66 0.68 1.16 0.77 ...
#  $ X6: num  1 1.32 1.08 0.93 1.36 2.94 1.56 0.9 1.23 0.78 ...
#  $ X7: num  1.45 1.31 1.01 1.47 1.66 1.56 3.11 1.03 1.7 0.81 ...
#  $ Y1: num  0.68 0.56 0.65 0.62 0.68 0.9 1.03 1.71 0.99 0.65 ...
#  $ Y2: num  0.98 1 0.78 1.26 1.16 1.23 1.7 0.99 3.07 0.61 ...
#  $ Y3: num  0.57 0.79 0.66 0.51 0.77 0.78 0.81 0.65 0.61 2.83 ...
#  $ Y4: num  1.07 1.13 0.93 0.94 1.37 1.65 1.63 0.86 1.43 1.04 ...
#  $ Y5: num  0.91 1.38 0.77 0.85 1.11 1.31 1.44 0.72 1.28 0.84 ...
X <- CETNEW.T[, 1:7]
Y <- CETNEW.T[, 8:12]
ccCETNEW <- cc(X, Y)

ccCETNEW 是包含结果的 5 个部分的列表。

R中具有不同矩阵维度的典型相关

Canonical Correlation in R with different matrix dimensions

r

correlation