平均值的 3 个标准差
3 standard deviations of the mean
我有一个数据集。这是生物学的 material。我输入了标准差,我可以看到我所有的数据条 2 数据点都在平均值的 3sd 以内。
是否接受落在平均值 3sd 以内的数据点在正常变化范围内?
还是取决于数据的范围和分散性?我不是数学家。只是有人想知道我是否有一个过程在控制之中。我一直理解 3sd 代表 95% 的数据,因此其中的数据在正态分布范围内,不值得研究。然而,我经常被要求根据图表的外观调查完全在 2sd 范围内的数据!。
当使用标准偏差时,什么时候应该将数据调查为异常?
非常感谢您的帮助
你应该看看68–95–99.7 rule。
如果您的数据服从正态分布,那么您的数据中大约有 95% (95.45%) 会落在与均值相差两个标准差的范围内。如果数据服从另一种分布,您可以用 Chebyshev's inequality 表示至少 75% 的数据必然落在两个标准差范围内。假设服从正态分布,大约 99.7% (99.73%) 的数据将落在平均值的三个标准差范围内。如果不是正态分布,至少有 89% (88.8888%) 会落在那里。
请注意,即使您的数据服从正态分布,机会(抽样误差)也会使这些百分比不完全如此。
所以数字确实取决于您的数据,尤其是数据的分布类型和数据点的数量。如果你有 1000 个数据点,你仍然会在 3 个标准偏差之外得到大约 3 个点。
我有一个数据集。这是生物学的 material。我输入了标准差,我可以看到我所有的数据条 2 数据点都在平均值的 3sd 以内。
是否接受落在平均值 3sd 以内的数据点在正常变化范围内?
还是取决于数据的范围和分散性?我不是数学家。只是有人想知道我是否有一个过程在控制之中。我一直理解 3sd 代表 95% 的数据,因此其中的数据在正态分布范围内,不值得研究。然而,我经常被要求根据图表的外观调查完全在 2sd 范围内的数据!。
当使用标准偏差时,什么时候应该将数据调查为异常?
非常感谢您的帮助
你应该看看68–95–99.7 rule。
如果您的数据服从正态分布,那么您的数据中大约有 95% (95.45%) 会落在与均值相差两个标准差的范围内。如果数据服从另一种分布,您可以用 Chebyshev's inequality 表示至少 75% 的数据必然落在两个标准差范围内。假设服从正态分布,大约 99.7% (99.73%) 的数据将落在平均值的三个标准差范围内。如果不是正态分布,至少有 89% (88.8888%) 会落在那里。
请注意,即使您的数据服从正态分布,机会(抽样误差)也会使这些百分比不完全如此。
所以数字确实取决于您的数据,尤其是数据的分布类型和数据点的数量。如果你有 1000 个数据点,你仍然会在 3 个标准偏差之外得到大约 3 个点。