方差分析不显着但系数变量显着?
ANOVA is not significant but coefficient variables are significant?
我从广义最小二乘模型(长寿 ~ 交配系统)生成了方差分析,结果不显着 (0.08)。然而,当我 运行 带有 summary() 的模型时,我可以看到每个系数(交配系统的类型)都很重要。
根据我(多次)阅读的内容,方差分析表明自变量的方差是否可以由因变量显着解释。而回归模型将测试因变量如何随着自变量水平的变化而变化。
但是,我觉得我遗漏了一些东西,因为我不确定我是否完全理解因变量的单个水平的 p 值是什么意思,以及因变量的总体 p 值是什么在 ANOVA 测试中。
我希望有人能用通俗易懂的术语解释我的结果。
假设你让人们处于不同的负载水平(low
、medium
、high
),我们将其称为你的自变量(与你的情况下的交配系统相同) ) 然后你测量他们对某物的反应时间 (rt
),这将是因变量(在你的情况下是长寿)
所以在 R 中,您的模型看起来像 rt ~ load
方差分析
当你运行单向方差分析时,你要测试的问题是"are the mean RT values in the low, medium, and high groups the same as each other?"
更正式地说,在假设检验中,您有所谓的原假设。在方差分析的情况下,零假设是:mean(low) = mean(medium) = mean(high)
,这是组均值都相等的另一种说法
ANOVA 测试是否可以拒绝零假设,这就是您的 p 值告诉您的内容。在您的情况下,p = .08
,您保留空值。您会得出结论,所有组的均值实际上是相等的
回归
回归操作略有不同,正是这种差异导致了结果的差异。
当你在回归中有一个分类变量时,虚拟变量由 R 创建。这是通过首先选择一个参考水平来实现的(假设 low
是参考)。然后创建 2 个虚拟变量,将您的每个其他级别与您的参考进行对比。因此,您的 2 个虚拟变量正在比较 low 与 medium 和 low 与 high
您会在回归模型的摘要中注意到您有多个系数和多个 p 值。 这些系数适用于您的每个虚拟变量
您在原来的 post 中提到了级别的概念:"regression model will test how the dependent variable changes with a change in the levels"。这就是这个想法发挥作用的地方
让我们采用虚拟变量之一,例如,低与高的虚拟变量。该虚拟变量具有相应的系数和 p 值。它们是什么意思?
系数告诉您如果从 low
组转到 high
组,您应该期望 rt
发生什么变化。 low
、medium
、high
也就是所谓的负载率"levels"。所以 "change in levels" 指的是从低到高 - 如果发生这种情况,因变量 (rt
) 的相应变化是什么?
更一般地说,您可以将此视为测试低组的均值是否与高组的均值相同
然后 p 值告诉您该变化(或平均差异)是否与 0 有显着差异(即低和高之间的 RT 变化量是否有意义?或者低组和高组是否具有相同的平均 RT?)
所以总而言之,您可以看到方差分析和回归测试的内容略有不同。回归更有针对性并测试特定级别之间的差异,而综合方差分析更广泛并测试所有级别的因素是否相等
我从广义最小二乘模型(长寿 ~ 交配系统)生成了方差分析,结果不显着 (0.08)。然而,当我 运行 带有 summary() 的模型时,我可以看到每个系数(交配系统的类型)都很重要。
根据我(多次)阅读的内容,方差分析表明自变量的方差是否可以由因变量显着解释。而回归模型将测试因变量如何随着自变量水平的变化而变化。
但是,我觉得我遗漏了一些东西,因为我不确定我是否完全理解因变量的单个水平的 p 值是什么意思,以及因变量的总体 p 值是什么在 ANOVA 测试中。
我希望有人能用通俗易懂的术语解释我的结果。
假设你让人们处于不同的负载水平(low
、medium
、high
),我们将其称为你的自变量(与你的情况下的交配系统相同) ) 然后你测量他们对某物的反应时间 (rt
),这将是因变量(在你的情况下是长寿)
所以在 R 中,您的模型看起来像 rt ~ load
方差分析
当你运行单向方差分析时,你要测试的问题是"are the mean RT values in the low, medium, and high groups the same as each other?"
更正式地说,在假设检验中,您有所谓的原假设。在方差分析的情况下,零假设是:mean(low) = mean(medium) = mean(high)
,这是组均值都相等的另一种说法
ANOVA 测试是否可以拒绝零假设,这就是您的 p 值告诉您的内容。在您的情况下,p = .08
,您保留空值。您会得出结论,所有组的均值实际上是相等的
回归
回归操作略有不同,正是这种差异导致了结果的差异。
当你在回归中有一个分类变量时,虚拟变量由 R 创建。这是通过首先选择一个参考水平来实现的(假设 low
是参考)。然后创建 2 个虚拟变量,将您的每个其他级别与您的参考进行对比。因此,您的 2 个虚拟变量正在比较 low 与 medium 和 low 与 high
您会在回归模型的摘要中注意到您有多个系数和多个 p 值。 这些系数适用于您的每个虚拟变量
您在原来的 post 中提到了级别的概念:"regression model will test how the dependent variable changes with a change in the levels"。这就是这个想法发挥作用的地方
让我们采用虚拟变量之一,例如,低与高的虚拟变量。该虚拟变量具有相应的系数和 p 值。它们是什么意思?
系数告诉您如果从 low
组转到 high
组,您应该期望 rt
发生什么变化。 low
、medium
、high
也就是所谓的负载率"levels"。所以 "change in levels" 指的是从低到高 - 如果发生这种情况,因变量 (rt
) 的相应变化是什么?
更一般地说,您可以将此视为测试低组的均值是否与高组的均值相同
然后 p 值告诉您该变化(或平均差异)是否与 0 有显着差异(即低和高之间的 RT 变化量是否有意义?或者低组和高组是否具有相同的平均 RT?)
所以总而言之,您可以看到方差分析和回归测试的内容略有不同。回归更有针对性并测试特定级别之间的差异,而综合方差分析更广泛并测试所有级别的因素是否相等