多元线性模型的解释

Interpretation of a multivariate linear model

我有一个关于线性多变量模型的模型矩阵和参数矩阵与 R 中的鸢尾花数据集拟合的问题。这是我正在使用的代码(函数 lm)和输出:

> (fm = lm(cbind(iris[,1],iris[,2],iris[,3],iris[,4])~(iris[,5])))

Call:
lm(formula = cbind(iris[, 1], iris[, 2], iris[, 3], iris[, 4]) ~ 
    (iris[, 5]))

Coefficients:
                     [,1]    [,2]    [,3]    [,4]  
(Intercept)           5.006   3.428   1.462   0.246
iris[, 5]versicolor   0.930  -0.658   2.798   1.080
iris[, 5]virginica    1.582  -0.454   4.090   1.780

我的objective是得到模型在矩阵中的分解:

多元模型的模型矩阵A和4×4参数矩阵β X = Aβ + E

据我所知,矩阵β就是上面刚刚得到的系数矩阵:

                    [,1]    [,2]    [,3]    [,4]  
(Intercept)           5.006   3.428   1.462   0.246
iris[, 5]versicolor   0.930  -0.658   2.798   1.080
iris[, 5]virginica    1.582  -0.454   4.090   1.780

因此,矩阵β不是一个3×4矩阵(3行4列)而不是4×4矩阵吗?

您可以查询 R 如何编码 Species 预测器:

contrasts( iris$Species )

## and verify how this applies to your model matrix:

model.matrix( fm )

简而言之 - 您不需要截距和 4 个参数。在这种情况下 setosa 是截距。因此 3x4。这是你要的吗?