使用 R 量化典型对应分析中变量的重要性? (x-post 来自 researchgate)

Quantifying importance of variables in Canonical Correspondence Analysis using R? (x-post from researchgate)

我目前有多个湖泊的物种丰度数据以及这些湖泊的一些环境变量的测量值。我决定对 R 中的数据进行规范对应分析,正如 ter Braak 和 Verdenschot (1995) 所证明的那样,请参阅 link:http://link.springer.com/article/10.1007%2FBF00877430(部分:"Ranking environmental variables in importance")

我对R还不太好,我也没有访问文章中指定的软件(CANOCO)。我的问题是,为了对环境变量的重要性进行逐步排序,我必须获得 Lambda(这与 Wilk 的 Lambda 相同吗?)并对每个 CCA 约束轴执行 Monte Carlo 排列测试。

有人知道我如何在 R 中做到这一点吗?我很想能够使用这个分析。

你想要vegancca()提供的anova()方法,包中做CCA的功能,如果你想在里面测试效果当前模型。有关详细信息,请参阅 ?anova.cca,也许还有 by = "margin" 选项来测试边际项。

要进行逐步选择,您有两个选择

  1. 使用标准 step() 函数,该函数与 CCA 的类 AIC 统计一起使用,或者
  2. 对于在那篇论文中完成并在 CANOCO 中实现的那种选择,您想要 ordistep()。这会通过排列测试对模型进行前向选择和后向消除测试更改。

Lambda 通常用来表示特征值,并不是 Wilk 的 Lambda。论文中会提到pseudo-F统计量,它就是在测试中计算出来的,它的排列给出了零假设下的抽样分布,最终决定了模型中项的显着性或项是否进入或离开模型。

有关详细信息,请参阅 ?ordistep