具有 2 个因素 R 的 ANCOVA 中不同组的平均值
Means of different groups in ANCOVA with 2 factors R
我目前正在研究不同性状对蜗牛 shell 体积的影响。
我有一个数据框,其中每一行代表一个给定的个体,还有几列及其所有属性(长度、shell 体积、性别、感染)。
我做了 ANCOVA:mod=aov(log(volume) ~ infection*sex*log(length))
。
我明白了:
Df Sum Sq Mean Sq F value Pr(>F)
inf 1 4.896 4.896 258.126 <2e-16 ***
sex 1 3.653 3.653 192.564 <2e-16 ***
log(length) 1 14.556 14.556 767.335 <2e-16 ***
inf:sex 1 0.028 0.028 1.472 0.227
inf:log(length) 1 0.020 0.020 1.064 0.304
sex:log(length) 1 0.001 0.001 0.076 0.783
inf:sex:log(length) 1 0.010 0.010 0.522 0.471
Residuals 174 3.301 0.019
性别、感染和长度的影响如此显着,但没有交互项。
由于没有相互作用,我想知道,对于给定的性别,log(volume) = f(log(length))
的截距对于感染个体还是未感染个体更大。
我尝试使用 summary.lm(mod)
,这给了我这个:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.42806 0.15429 -2.774 0.00613 **
infmic -0.54963 0.40895 -1.344 0.18070
sexM -0.11542 0.35508 -0.325 0.74554
log(length) 2.41915 0.11144 21.709 < 2e-16 ***
infmic:sexM 0.52459 0.63956 0.820 0.41320
infmic:log(length) 0.43215 0.33717 1.282 0.20166
sexM:log(length) 0.04207 0.28113 0.150 0.88122
infmic:sexM:log(length) -0.38222 0.52920 -0.722 0.47110
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1377 on 174 degrees of freedom
Multiple R-squared: 0.8753, Adjusted R-squared: 0.8703
F-statistic: 174.5 on 7 and 174 DF, p-value: < 2.2e-16
但是我在解释结果时遇到了问题,而且仍然不知道如何得出结论。
我还有 "few" 个其他问题:
为什么 lm 输出中的性别和感染不重要?
我知道这在这里并不重要,但是如何解释有关交互项的线条?
我认为 infmic:sexM 表示感染男性与未感染女性相比 log(volume)=f(log(length)) 的斜率变化。那么,infmic:length会不会是感染女性和未感染女性之间的斜率变化?还有sexM:length未感染的男性和未感染的女性之间的变化?这是真的?
三重相互作用项代表什么?
非常感谢!
编辑:我找到了部分答案。
让我们将数据分成 4 组(F-NI、F-I、M-NI、M-I),并为每组寻找回归线 log(volume) = f(log(length)) 的方程这些团体。此处,系数是由函数 summary.lm(mod)
给出的系数
等式是:
- 对于未感染的女性:
log(volume) = (Intercept) + log(length)
- 对于受感染的女性:
log(volume) = (Intercept) + infmic + log(length) + infmic:log(length)
- 对于未感染的男性:
log(volume) = (Intercept) + sexM + log(length) + sexM:log(length)
- 对于受感染的男性:
log(volume) = (Intercept) + infmic + sexM + infmic:sexM + log(length) + infmic:log(length) + sexM:log(length) + infmic:sexM:log(length)
对于每个方程,斜率是开始于log(length)
的部分,截距是之前的部分。
对有些人来说可能很明显,但我一开始真的不明白每个系数代表什么,所以我更愿意把它放在这里!
爱丽丝
我目前正在研究不同性状对蜗牛 shell 体积的影响。 我有一个数据框,其中每一行代表一个给定的个体,还有几列及其所有属性(长度、shell 体积、性别、感染)。
我做了 ANCOVA:mod=aov(log(volume) ~ infection*sex*log(length))
。
我明白了:
Df Sum Sq Mean Sq F value Pr(>F)
inf 1 4.896 4.896 258.126 <2e-16 ***
sex 1 3.653 3.653 192.564 <2e-16 ***
log(length) 1 14.556 14.556 767.335 <2e-16 ***
inf:sex 1 0.028 0.028 1.472 0.227
inf:log(length) 1 0.020 0.020 1.064 0.304
sex:log(length) 1 0.001 0.001 0.076 0.783
inf:sex:log(length) 1 0.010 0.010 0.522 0.471
Residuals 174 3.301 0.019
性别、感染和长度的影响如此显着,但没有交互项。
由于没有相互作用,我想知道,对于给定的性别,log(volume) = f(log(length))
的截距对于感染个体还是未感染个体更大。
我尝试使用 summary.lm(mod)
,这给了我这个:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.42806 0.15429 -2.774 0.00613 **
infmic -0.54963 0.40895 -1.344 0.18070
sexM -0.11542 0.35508 -0.325 0.74554
log(length) 2.41915 0.11144 21.709 < 2e-16 ***
infmic:sexM 0.52459 0.63956 0.820 0.41320
infmic:log(length) 0.43215 0.33717 1.282 0.20166
sexM:log(length) 0.04207 0.28113 0.150 0.88122
infmic:sexM:log(length) -0.38222 0.52920 -0.722 0.47110
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1377 on 174 degrees of freedom
Multiple R-squared: 0.8753, Adjusted R-squared: 0.8703
F-statistic: 174.5 on 7 and 174 DF, p-value: < 2.2e-16
但是我在解释结果时遇到了问题,而且仍然不知道如何得出结论。 我还有 "few" 个其他问题:
为什么 lm 输出中的性别和感染不重要? 我知道这在这里并不重要,但是如何解释有关交互项的线条?
我认为 infmic:sexM 表示感染男性与未感染女性相比 log(volume)=f(log(length)) 的斜率变化。那么,infmic:length会不会是感染女性和未感染女性之间的斜率变化?还有sexM:length未感染的男性和未感染的女性之间的变化?这是真的? 三重相互作用项代表什么?
非常感谢!
编辑:我找到了部分答案。
让我们将数据分成 4 组(F-NI、F-I、M-NI、M-I),并为每组寻找回归线 log(volume) = f(log(length)) 的方程这些团体。此处,系数是由函数 summary.lm(mod)
等式是:
- 对于未感染的女性:
log(volume) = (Intercept) + log(length)
- 对于受感染的女性:
log(volume) = (Intercept) + infmic + log(length) + infmic:log(length)
- 对于未感染的男性:
log(volume) = (Intercept) + sexM + log(length) + sexM:log(length)
- 对于受感染的男性:
log(volume) = (Intercept) + infmic + sexM + infmic:sexM + log(length) + infmic:log(length) + sexM:log(length) + infmic:sexM:log(length)
对于每个方程,斜率是开始于log(length)
的部分,截距是之前的部分。
对有些人来说可能很明显,但我一开始真的不明白每个系数代表什么,所以我更愿意把它放在这里!
爱丽丝