R vegan species-scores 和 Primer Spearman rank correlation of species to axis 之间有什么区别?
What is the difference between R vegan species-scores, and Primer Spearman rank correlation of species to axis?
在约束排序分析中,如 CAP
或 dbRDA
,研究人员通常想知道有多少差异归因于特定物种。在 Primer PERMANOVA
、Spearman rank
或 Pearson correlations
中,轴的物种是一个选项,它提供了使用 CAP 或 RDA 时描述物种组合之间变异特征的物种估计值。在 R 中,vegan
提供了一种不同的度量,称为物种分数,可以计算 但必须仔细考虑潜在的缺点 https://github.com/vegandevs/vegan/issues/254#issuecomment-334071917。
和 ,当使用 capscale 时。
我想更好地了解 Primer PERMANOVA
中相关性和物种分数是如何计算的。首先,这些方法旨在展示的内容是否存在真正的区别?使用 Spearman
或 Pearson correlations
比 R- vegan
's species scores? Does the method of calculating the species-to-axis correlations in Primer suffer from similar problems as detailed in the above links for species scores in capscale
or dbrda
in R? In Primer, what are the variables used from the community matrix and axis to calculate the correlations between them? Are these raw or the transformed data? And finally, if the correlation method is a better estimate of the relative amount by which species cause differences between assemblages than species scores in R, should this be considered as an alternative to R vegan' 物种分数有哪些优点和缺点?
我从未见过 PRIMER,我无法评论 vegan 和 PRIMER 之间的差异,但我可以解释一下我们在 vegan.
中的工作方式
如果您将拟合环境变量的物种得分视为箭头,则有两个不同的方面:方向和长度。先说箭头的方向。
一般情况下,箭头不平行于坐标轴,而是指向物种或环境变量变化最快的方向。箭头的方向可以从线性模型lm(y ~ Ax1 + Ax2)
中找到。如果 y
是一个物种,这将给出物种得分的箭头,如果 y
是一个环境变量,这将给出一个拟合向量。将物种与轴相关联意味着两个独立的模型 lm(y ~ Ax1)
和 lm(y ~ Ax2)
。 vegan 模型定义了一个线性趋势面,轴模型定义了两个独立的线性趋势面,每个趋势面沿一个轴具有最陡的梯度。以下示例显示线性模型如何与 vegan:
中 PCA 中的物种得分相关
library(vegan)
data(varespec)
pc <- rda(varespec)
biplot(pc) # species scores as biplot arrows
plot(envfit(pc ~ Pleuschr + Cladarbu + Cladrang + Cladstel, varespec))
ordisurf(pc ~ Cladstel, varespec, knots = 1, add = TRUE)
envfit
函数添加指向与物种得分相同方向的箭头,ordisurf
向 Cladstel
添加线性 (knots = 1
) 趋势面。线性趋势面的等斜线等于 spaced 并且垂直于箭头。将采样单位投影到箭头给出了此二维解决方案中预测的物种丰度。物种得分的解释在RDA中是类似的,但是那里你必须记住使用线性组合得分(display="lc"
),而在CCA中你必须记住使用加权回归(envfit
和ordisurf
自动处理,但使用 lm
或其他非 vegan 工具,您需要明确的权重)。
这种方法不容易更改为使用等级相关性。对于等级,您需要将点(采样单位)投影到单变量序列。人们通常在坐标轴上进行投影(也就是说,他们将坐标轴与物种相关联)。但是,如果我们找到一条通过原点的线,当将抽样单元投影到其上以获取等级时(如果存在唯一线或包含线的扇区),则可以找到更好的相关性。这类似于我们寻找线性趋势面中变化最大的方向的方法。这很容易用欧几里德 space 完成,就像所有 vegan 排序 space 一样,但不是用投影的等级。
线性趋势面的假设相当简单。它是 PCA 和 RDA 中的物种模型,也是 RDA 中的约束模型,它显示了分析如何看待您的数据(记住 "lc"
分数!)。然而,对于其他变量和其他排序方法,更复杂的响应模型通常更合适。这些可以使用 ordisurf
和 knots
> 1 来拟合[ted]。
然后是关于箭头的长度,或者物种分数与原点的距离。 envfit()
函数找到了正确的方向,但它通过相关系数缩放箭头长度。在 PCA 和 RDA 中,我们有几个替代的缩放选项:请参阅 ?scores.cca
中对 scaling
和 correlation
的详细描述。默认 (correlation = FALSE
) 缩放使箭头与物种丰度的绝对变化成正比。也就是说,丰富的物种可以变化很大,可以有长箭头,但稀有物种只能变化一点,并且总是有短箭头。是绝对变化,不是相对变化。对于 correlation = TRUE
,箭头长度与相对变化成正比,类似于 envfit
中使用的相关性缩放。同样,请仔细阅读手册 (?scores.cca
)。
请参阅下面 Marti Anderson 对与上述问题相关的电子邮件的非常有用的回复 - 经她许可复制:
亲爱的菲利普,
感谢您的留言以及对所有这些方法及其解释的兴趣。
我不会评论在 vegan 中实现的基于 R 的东西,毫无疑问 Jari 最能做到这一点,但我很乐意评论 [=20= 中实现的原始等级(或 Perason)相关向量] 软件。
首先,让我强调,这些旨在成为一种探索工具。很简单,它们所做的只是显示单个物种(或其他变量)与排序轴的原始(或多重)相关性。使用它们的两个重要注意事项或此处需要注意的重要事项。首先,他们最强调的是没有直接告诉你任何关于个别物种在 dbRDA(或 nMDS 或 PCO 或你正在谈论的任何排序轴)中看到的驱动模式中可能发挥的具体作用。他们不能这样做,因为它们是在事后绘制的,而且,正如我们所知,在很多情况下,原始物种变量和排序轴之间的关系根本不是线性的(甚至是单调的)。排序(通常)在某些选定的相异性度量(例如 BC 或 Jaccard 等)的 space 中完成。出于很多原因(我相信您已经知道,我不会深入),这是合适的。要查看约束排序 space 中单个物种的模式,如 dbRDA(或任何其他排序),我建议您使用气泡图,这是一种更精细的可视化模式工具。 (顺便说一句,在 PRIMER 7 中,您可以通过这种方式叠加分段的气泡图,以同时可视化一组物种的模式。气泡图的优点是,对于任何给定的物种,它们能够显示可能存在的任何模式。发生,包括跨组的阶跃变化、跨因素的潜在相互作用、沿梯度的单峰或多峰模式等。现在,使用等级(或 Pearson)相关向量具有能够同时绘制大量物种的优势, 但相比之下,它们显然是一个钝器,因为它们只能很好地显示那些可能与排序轴有增加或减少关系的物种,如果不是全部的话。它们有它们的用途,但是,特别是在 CAP 中设置,其中专门绘制轴以最大化组差异。在这种情况下,组在图上是分开的,因此绘制较长轴的物种在这些图上增加或减少通常对应于那些表征群体差异的物种。然而,即使在 CAP 示例中,有时群体差异是由整组(次要)物种的组成变化引起的,这些物种通过相异性度量以多变量和同时的方式一起作用,并且这可能不容易被任何单一模式所拾取这些物种在独立和单独考虑时。
好吧,我确实希望我能帮助澄清这里的问题。以上所有内容的结果是,将这些向量放在您可能选择的任何排序图上都没有问题,但它们是一种启发式和后验练习,而不是基于差异的设置中的确定或诊断工具,他们只表现出某种关系。其他工具(例如气泡图或分段气泡图)在关于个体物种模式的信息内容方面会更加丰富。
希望以上内容对您有所帮助!
亲切的问候,
马蒂·安德森
在约束排序分析中,如 CAP
或 dbRDA
,研究人员通常想知道有多少差异归因于特定物种。在 Primer PERMANOVA
、Spearman rank
或 Pearson correlations
中,轴的物种是一个选项,它提供了使用 CAP 或 RDA 时描述物种组合之间变异特征的物种估计值。在 R 中,vegan
提供了一种不同的度量,称为物种分数,可以计算 但必须仔细考虑潜在的缺点 https://github.com/vegandevs/vegan/issues/254#issuecomment-334071917。
和
我想更好地了解 Primer PERMANOVA
中相关性和物种分数是如何计算的。首先,这些方法旨在展示的内容是否存在真正的区别?使用 Spearman
或 Pearson correlations
比 R- vegan
's species scores? Does the method of calculating the species-to-axis correlations in Primer suffer from similar problems as detailed in the above links for species scores in capscale
or dbrda
in R? In Primer, what are the variables used from the community matrix and axis to calculate the correlations between them? Are these raw or the transformed data? And finally, if the correlation method is a better estimate of the relative amount by which species cause differences between assemblages than species scores in R, should this be considered as an alternative to R vegan' 物种分数有哪些优点和缺点?
我从未见过 PRIMER,我无法评论 vegan 和 PRIMER 之间的差异,但我可以解释一下我们在 vegan.
中的工作方式如果您将拟合环境变量的物种得分视为箭头,则有两个不同的方面:方向和长度。先说箭头的方向。
一般情况下,箭头不平行于坐标轴,而是指向物种或环境变量变化最快的方向。箭头的方向可以从线性模型lm(y ~ Ax1 + Ax2)
中找到。如果 y
是一个物种,这将给出物种得分的箭头,如果 y
是一个环境变量,这将给出一个拟合向量。将物种与轴相关联意味着两个独立的模型 lm(y ~ Ax1)
和 lm(y ~ Ax2)
。 vegan 模型定义了一个线性趋势面,轴模型定义了两个独立的线性趋势面,每个趋势面沿一个轴具有最陡的梯度。以下示例显示线性模型如何与 vegan:
library(vegan)
data(varespec)
pc <- rda(varespec)
biplot(pc) # species scores as biplot arrows
plot(envfit(pc ~ Pleuschr + Cladarbu + Cladrang + Cladstel, varespec))
ordisurf(pc ~ Cladstel, varespec, knots = 1, add = TRUE)
envfit
函数添加指向与物种得分相同方向的箭头,ordisurf
向 Cladstel
添加线性 (knots = 1
) 趋势面。线性趋势面的等斜线等于 spaced 并且垂直于箭头。将采样单位投影到箭头给出了此二维解决方案中预测的物种丰度。物种得分的解释在RDA中是类似的,但是那里你必须记住使用线性组合得分(display="lc"
),而在CCA中你必须记住使用加权回归(envfit
和ordisurf
自动处理,但使用 lm
或其他非 vegan 工具,您需要明确的权重)。
这种方法不容易更改为使用等级相关性。对于等级,您需要将点(采样单位)投影到单变量序列。人们通常在坐标轴上进行投影(也就是说,他们将坐标轴与物种相关联)。但是,如果我们找到一条通过原点的线,当将抽样单元投影到其上以获取等级时(如果存在唯一线或包含线的扇区),则可以找到更好的相关性。这类似于我们寻找线性趋势面中变化最大的方向的方法。这很容易用欧几里德 space 完成,就像所有 vegan 排序 space 一样,但不是用投影的等级。
线性趋势面的假设相当简单。它是 PCA 和 RDA 中的物种模型,也是 RDA 中的约束模型,它显示了分析如何看待您的数据(记住 "lc"
分数!)。然而,对于其他变量和其他排序方法,更复杂的响应模型通常更合适。这些可以使用 ordisurf
和 knots
> 1 来拟合[ted]。
然后是关于箭头的长度,或者物种分数与原点的距离。 envfit()
函数找到了正确的方向,但它通过相关系数缩放箭头长度。在 PCA 和 RDA 中,我们有几个替代的缩放选项:请参阅 ?scores.cca
中对 scaling
和 correlation
的详细描述。默认 (correlation = FALSE
) 缩放使箭头与物种丰度的绝对变化成正比。也就是说,丰富的物种可以变化很大,可以有长箭头,但稀有物种只能变化一点,并且总是有短箭头。是绝对变化,不是相对变化。对于 correlation = TRUE
,箭头长度与相对变化成正比,类似于 envfit
中使用的相关性缩放。同样,请仔细阅读手册 (?scores.cca
)。
请参阅下面 Marti Anderson 对与上述问题相关的电子邮件的非常有用的回复 - 经她许可复制:
亲爱的菲利普,
感谢您的留言以及对所有这些方法及其解释的兴趣。 我不会评论在 vegan 中实现的基于 R 的东西,毫无疑问 Jari 最能做到这一点,但我很乐意评论 [=20= 中实现的原始等级(或 Perason)相关向量] 软件。 首先,让我强调,这些旨在成为一种探索工具。很简单,它们所做的只是显示单个物种(或其他变量)与排序轴的原始(或多重)相关性。使用它们的两个重要注意事项或此处需要注意的重要事项。首先,他们最强调的是没有直接告诉你任何关于个别物种在 dbRDA(或 nMDS 或 PCO 或你正在谈论的任何排序轴)中看到的驱动模式中可能发挥的具体作用。他们不能这样做,因为它们是在事后绘制的,而且,正如我们所知,在很多情况下,原始物种变量和排序轴之间的关系根本不是线性的(甚至是单调的)。排序(通常)在某些选定的相异性度量(例如 BC 或 Jaccard 等)的 space 中完成。出于很多原因(我相信您已经知道,我不会深入),这是合适的。要查看约束排序 space 中单个物种的模式,如 dbRDA(或任何其他排序),我建议您使用气泡图,这是一种更精细的可视化模式工具。 (顺便说一句,在 PRIMER 7 中,您可以通过这种方式叠加分段的气泡图,以同时可视化一组物种的模式。气泡图的优点是,对于任何给定的物种,它们能够显示可能存在的任何模式。发生,包括跨组的阶跃变化、跨因素的潜在相互作用、沿梯度的单峰或多峰模式等。现在,使用等级(或 Pearson)相关向量具有能够同时绘制大量物种的优势, 但相比之下,它们显然是一个钝器,因为它们只能很好地显示那些可能与排序轴有增加或减少关系的物种,如果不是全部的话。它们有它们的用途,但是,特别是在 CAP 中设置,其中专门绘制轴以最大化组差异。在这种情况下,组在图上是分开的,因此绘制较长轴的物种在这些图上增加或减少通常对应于那些表征群体差异的物种。然而,即使在 CAP 示例中,有时群体差异是由整组(次要)物种的组成变化引起的,这些物种通过相异性度量以多变量和同时的方式一起作用,并且这可能不容易被任何单一模式所拾取这些物种在独立和单独考虑时。
好吧,我确实希望我能帮助澄清这里的问题。以上所有内容的结果是,将这些向量放在您可能选择的任何排序图上都没有问题,但它们是一种启发式和后验练习,而不是基于差异的设置中的确定或诊断工具,他们只表现出某种关系。其他工具(例如气泡图或分段气泡图)在关于个体物种模式的信息内容方面会更加丰富。
希望以上内容对您有所帮助! 亲切的问候, 马蒂·安德森