pandas 汇总统计的经济状况调查有差异吗?
Difference in means test on pandas's summary statistics?
我希望对两个 DataFrame 的汇总统计数据执行均值差异测试。
df1[['sd']].describe()
sd
count 5000.000000
mean 0.635558
std 0.086109
min 0.492922
25% 0.577885
50% 0.639906
75% 0.688645
max 0.800767
df2[['sd']].describe()
sd
count 5000.000000
mean 0.640954
std 0.084459
min 0.496823
25% 0.577373
50% 0.644122
75% 0.693863
max 0.798076
我正在寻找一些函数,我可以调用这些汇总统计数据来告诉我我的均值差异是否具有统计显着性。
如果您观察到来自相同或不同总体的两个独立样本,则对独立样本执行 t 检验。
这是对两个独立样本的平均值相等的原假设的双侧检验。
from scipy.stats import ttest_ind
ttest_ind(df1['sd'], df2['sd'])
输出将是 t 统计量和 p 值。
我希望对两个 DataFrame 的汇总统计数据执行均值差异测试。
df1[['sd']].describe()
sd
count 5000.000000
mean 0.635558
std 0.086109
min 0.492922
25% 0.577885
50% 0.639906
75% 0.688645
max 0.800767
df2[['sd']].describe()
sd
count 5000.000000
mean 0.640954
std 0.084459
min 0.496823
25% 0.577373
50% 0.644122
75% 0.693863
max 0.798076
我正在寻找一些函数,我可以调用这些汇总统计数据来告诉我我的均值差异是否具有统计显着性。
如果您观察到来自相同或不同总体的两个独立样本,则对独立样本执行 t 检验。
这是对两个独立样本的平均值相等的原假设的双侧检验。
from scipy.stats import ttest_ind
ttest_ind(df1['sd'], df2['sd'])
输出将是 t 统计量和 p 值。