在两个 pandas 系列上应用 ttest_ind 时，t-stats 值的意义是什么？

What is the significance of t-stats value while applying ttest_ind on two pandas series?

当 ttest_ind 应用于两个独立的系列时，从得到的 t-stats 值可以得出什么结论？

如您所见here，scipy.stats.ttest_ind 有两个输出

计算出来的t-statistic.
two-tailed p-value.

非常直观地，您可以将 t-statistic 解读为两个总体平均值的归一化差异，考虑到它们的方差和大小：

样本越大，平均值的差异越严重，因为我们有更多的证据。
方差越大，平均值的差异越小，因为绝对差异只能由随机性给出。

t-statistic的值越高，差异越严重

p-value 使这种直觉更加明确：它是平均值的差异可以被视为零的概率。如果 p-value 低于阈值，例如0.05，我们说差值不为零。