非正态分布的大样本能否计算t检验?

Can t-test be calculated on large samples with non-normal distribution?

非正态分布的大样本能否计算t检验?

例如A组用户数为100K,B组用户数为100K。我想测试这两组的平均会话持续时间是否具有统计显着性。

第一种方法)我们计算了这些用户在 AB 测试后的第二天(DAY1)的平均会话时长为

我们知道 A 组和 B 组的用户的 DAY1 会话值呈非正态分布。 在这种情况下,使用两个样本 t 检验来测试两组的 DAY1 平均会话持续时间是否正确? (我们将接受 n=100K) (一些消息来源说,即使在非正态分布的情况下,计算大样本的 t 分数也会给出准确的结果。)

第二种方法)在 AB 测试开放的那一天计算每日平均会话持续时间的 t 分数是否是正确的方法? 例如;在下面的场景中,计算了 A 组和 B 组中 100K 用户的平均每日会话时长。我们将这里的天数作为观察次数,得到 n=30。 我们还将计算 n=30 上的双样本 t 检验计算。

Group day0 avg duration day1 avg duration day2 avg duration ... day30 av gduration
A 30.2 31.2 32.4 ... 33.2
B 29.1 30.2 30.4 ... 30.1

这些方法是否给出正确的结果,或者在这种情况下是否有必要应用其他方法? 在 AB 检验中计算大样本的 t 检验是否有意义?

t 检验假定从总体中获取的不同样本的均值呈正态分布。它不假设人口本身是正态分布的。

对于方差有限的总体,中心极限定理表明总体样本的均值呈正态分布。但是,均值分布近似正态所需的样本量取决于总体的非正态程度。 t检验对来自非正态分布的小样本无效,但对来自非正态分布的大样本有效。

方法 1 由于这个原因(大样本大小~100K)有效,你是正确的计算大样本的 t 分数即使在非正态分布下也会给出准确的结果. [您也可以考虑对您正在使用的样本量 (100K) 使用 z 检验。 T 检验更适合较小的样本量,例如 n < 30]

方法 2 之所以有效,是因为根据中心极限定理,在给定足够样本的情况下,日平均值应该服从正态分布。耗时数据集可能存在偏差,但通常运行良好。