从样本均值估计标准误差

estimate standard error from sample means

从大型 population.A 中抽取 143 名女孩和 127 名男孩的随机样本,对每个 child 的血红蛋白水平(在 g/dl 中测量)进行测量,结果如下.

女孩 n=143 平均值 = 11.35 sd = 1.41 男孩 n=127 平均 11.01 sd =1.32 估计样本均值之差的标准误差

本质上,我们会通过相加来汇集标准误差。这意味着我们正在回答这个问题:考虑到 both 个样本,抽样分布的变化是什么?

SD = sqrt( (sd₁**2 / n₁) + (sd₂**2 / n₂) \

SD = sqrt( (1.41**2 / 143) + (1.32**2 / 127) ≈ 0.1662

请注意,标准差的平方就是每个样本的方差。如您所见,在我们的例子中,该值非常小,这表明采样均值之间的差异不需要那么大,因为观测值之间的差异大于预期。

我们将平均值之间的差异计算为 0.34(或 -0.34,具体取决于问题的性质)并将此差异除以标准误差以获得 t-value。在我们的案例中,2.046(或 -2.046)表示观察到的差异比我们预期的平均差异大 2.046 倍,给定我们测量的变异 AND 样本大小。

但是,我们需要通过确定 t-critical 值来验证此观察结果是否具有统计显着性。这个 t-critical 可以通过使用 t-value 图表轻松计算:需要知道 alpha(除非另有说明,通常为 0.05),需要知道原始备择假设(如果它符合性别之间存在差异 那么我们将应用双尾分布 - 如果它符合 性别 X 具有血红蛋白水平 larger/smaller比性别 X 那么我们将使用单尾分布)。

如果 t-value > t-critical 那么我们会声称均值之间的差异具有统计显着性,从而有足够的证据拒绝原假设.或者,如果 t-value < t-critical,我们将没有统计上显着的证据反对原假设,因此我们将无法拒绝原假设。