在两个 pandas 系列上应用 ttest_ind 时,t-stats 值的意义是什么?
What is the significance of t-stats value while applying ttest_ind on two pandas series?
当 ttest_ind 应用于两个独立的系列时,从得到的 t-stats 值可以得出什么结论?
如您所见here,scipy.stats.ttest_ind
有两个输出
- 计算出来的t-statistic.
- two-tailed p-value.
非常直观地,您可以将 t-statistic 解读为两个总体平均值的归一化差异,考虑到它们的方差和大小:
- 样本越大,平均值的差异越严重,因为我们有更多的证据。
- 方差越大,平均值的差异越小,因为绝对差异只能由随机性给出。
t-statistic的值越高,差异越严重
p-value 使这种直觉更加明确:它是平均值的差异可以被视为零的概率。如果 p-value 低于阈值,例如0.05,我们说差值不为零。
当 ttest_ind 应用于两个独立的系列时,从得到的 t-stats 值可以得出什么结论?
如您所见here,scipy.stats.ttest_ind
有两个输出
- 计算出来的t-statistic.
- two-tailed p-value.
非常直观地,您可以将 t-statistic 解读为两个总体平均值的归一化差异,考虑到它们的方差和大小:
- 样本越大,平均值的差异越严重,因为我们有更多的证据。
- 方差越大,平均值的差异越小,因为绝对差异只能由随机性给出。
t-statistic的值越高,差异越严重
p-value 使这种直觉更加明确:它是平均值的差异可以被视为零的概率。如果 p-value 低于阈值,例如0.05,我们说差值不为零。