prcomp公式中自变量的含义

The meaning of the independent variables in prcomp formula

我正在阅读 Kuhn 和 Johnson 的“应用预测建模”。在章节 3.3 Data Transformations for Multiple Predictors 的代码中,有一个代码片段:

pr <- prcomp(~ AvgIntenCh1 + EntropyIntenCh1,
             data = segTrainTrans,
             scale. = TRUE)

完整代码示例 here.

prcomp 的文档中,我找不到太多关于第一个参数是如何解释的(这个 ~ AvgIntenCh1 + EntropyIntenCh1 公式)。它只是说:

 formula: a formula with no response variable, referring only to
          numeric variables.

prcomp 调用如何使用该公式,它是什么意思?

我认为这只是指定 运行 PCA 上哪些变量的另一种方法。这似乎相当于只指定 x 而不是 formula.

prcomp(iris[,-5])
#> Standard deviations (1, .., p=4):
#> [1] 2.0562689 0.4926162 0.2796596 0.1543862
#> 
#> Rotation (n x k) = (4 x 4):
#>                      PC1         PC2         PC3        PC4
#> Sepal.Length  0.36138659 -0.65658877  0.58202985  0.3154872
#> Sepal.Width  -0.08452251 -0.73016143 -0.59791083 -0.3197231
#> Petal.Length  0.85667061  0.17337266 -0.07623608 -0.4798390
#> Petal.Width   0.35828920  0.07548102 -0.54583143  0.7536574

prcomp(~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)
#> Standard deviations (1, .., p=4):
#> [1] 2.0562689 0.4926162 0.2796596 0.1543862
#> 
#> Rotation (n x k) = (4 x 4):
#>                      PC1         PC2         PC3        PC4
#> Sepal.Length  0.36138659 -0.65658877  0.58202985  0.3154872
#> Sepal.Width  -0.08452251 -0.73016143 -0.59791083 -0.3197231
#> Petal.Length  0.85667061  0.17337266 -0.07623608 -0.4798390
#> Petal.Width   0.35828920  0.07548102 -0.54583143  0.7536574

reprex package (v2.0.1)

于 2022-04-05 创建