在两个 pandas 系列上应用 ttest_ind 时,t-stats 值的意义是什么?

What is the significance of t-stats value while applying ttest_ind on two pandas series?

当 ttest_ind 应用于两个独立的系列时,从得到的 t-stats 值可以得出什么结论?

如您所见herescipy.stats.ttest_ind 有两个输出

  • 计算出来的t-statistic.
  • two-tailed p-value.

非常直观地,您可以将 t-statistic 解读为两个总体平均值的归一化差异,考虑到它们的方差和大小:

  • 样本越大,平均值的差异越严重,因为我们有更多的证据。
  • 方差越大,平均值的差异越小,因为绝对差异只能由随机性给出。

t-statistic的值越高,差异越严重

p-value 使这种直觉更加明确:它是平均值的差异可以被视为零的概率。如果 p-value 低于阈值,例如0.05,我们说差值不为零。