这种相关性在统计上显着吗?
Is this correlation statistically significant?
我有一个数据框:
A
B
0.5
69.26
1
74.91
1.5
77.21
2
77.52
我运行
cor, pval = pearsonr( data["A"], data["B"])
答案是:
相关系数 = 0.91 和 p 值 = 0.09
我的显着性水平 alpha = 0.05。我如何解释这样的结果?数据是否相关?
我问是因为我发现了几个相互否认的消息来源。一个说 p 值应该小,另一个说 p 值应该高,以说明相关性存在。
另外,我想知道我可以肯定地说数据相关的系数。例如,如果系数。 0.9 相当高,我可以断言它仍然相关但系数肯定为 0.4 吗?
在你的情况下:不,没有显着的相关性,因为你的 p 值(这是原假设的计算概率,即两个变量之间的联系是随机波动的结果而不是因果关系 link) 为 9 %,因此高于所选显着性值 5 %。
注意这不是Scipy的问题;这是解释统计分析给您的结果的问题。
另请注意,现在将显着性阈值更改为 10% 在方法论上是错误的。在该阈值下,结果确实具有统计显着性,但正确的方法要求您事先设置适用的阈值 ,然后将结果与其进行比较,而不是事后进行调整以使结果合适期望的结果。
我有一个数据框:
A | B |
---|---|
0.5 | 69.26 |
1 | 74.91 |
1.5 | 77.21 |
2 | 77.52 |
我运行
cor, pval = pearsonr( data["A"], data["B"])
答案是: 相关系数 = 0.91 和 p 值 = 0.09
我的显着性水平 alpha = 0.05。我如何解释这样的结果?数据是否相关?
我问是因为我发现了几个相互否认的消息来源。一个说 p 值应该小,另一个说 p 值应该高,以说明相关性存在。
另外,我想知道我可以肯定地说数据相关的系数。例如,如果系数。 0.9 相当高,我可以断言它仍然相关但系数肯定为 0.4 吗?
在你的情况下:不,没有显着的相关性,因为你的 p 值(这是原假设的计算概率,即两个变量之间的联系是随机波动的结果而不是因果关系 link) 为 9 %,因此高于所选显着性值 5 %。
注意这不是Scipy的问题;这是解释统计分析给您的结果的问题。
另请注意,现在将显着性阈值更改为 10% 在方法论上是错误的。在该阈值下,结果确实具有统计显着性,但正确的方法要求您事先设置适用的阈值 ,然后将结果与其进行比较,而不是事后进行调整以使结果合适期望的结果。