Wilcoxon 秩和结果:相同的 pvalue 一遍又一遍?
Wilcoxon rank sum results: same pvalue over and over?
我正在将成对的列数据与 wilcoxon 秩和检验进行比较,并且在大多数比较中我得到了完全相同的 pvalue。我想知道是从数据上判断是我犯了错误还是一切都好。这是一些比较。
这是我用的比较
wtresult<-wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)
这是上面使用的数据的结果。
X1 X2 X3
339.53 354.11 435.56 425.34 434.64 436.08
X1 X2 X3
312.1 282.2 281.6 NA NA NA
Wilcoxon rank sum test
data: datachunk[, i] and datachunk[, (i + 1)]
W = 18, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0
X1 X2 X3
161.21 150.01 183.47 201.51 234.70 321.00
X1 X2 X3
501.0 520.1 500.7 NA NA NA
Wilcoxon rank sum test
data: datachunk[, i] and datachunk[, (i + 1)]
W = 0, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0
X1 X2 X3
247.79 159.64 192.00 262.86 403.33 336.21
X1 X2 X3
60.33 66.04 55.23 NA NA NA
Wilcoxon rank sum test
data: datachunk[, i] and datachunk[, (i + 1)]
W = 18, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0
X1 X2 X3
17.12 15.83 16.88 17.61 18.97 45.92
X1 X2 X3
321.8 329.7 334.4 NA NA NA
对于少量观察,测试有点 "chunky" 所以如果你有边界情况(所有第一个参数值都大于第二个参数值,反之亦然)你会得到相同的 p - 全部为 0 或其他数字(取决于 n)的值和 W 统计数据。
要获得更详细的答案,我们需要查看您的数据,或者您需要同意查看我们都可以看到的其他一些数据。
这是一个代码示例,它显示了我正在谈论的行为
i <- 1
datachunk <- mtcars[1:5,]
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)
i <- 2
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)
由于在您的每个测试示例中,一个组中的所有值都大于另一组中的所有值,因此无论实际数值如何,分配给每个差异的带符号排名都是相同的。因此,您的测试统计数据和 p 值都是相同的。
所以在数学上它是有道理的,但我会考虑在这么小的样本量下测试的应用是否有意义。
我正在将成对的列数据与 wilcoxon 秩和检验进行比较,并且在大多数比较中我得到了完全相同的 pvalue。我想知道是从数据上判断是我犯了错误还是一切都好。这是一些比较。
这是我用的比较
wtresult<-wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)
这是上面使用的数据的结果。
X1 X2 X3
339.53 354.11 435.56 425.34 434.64 436.08
X1 X2 X3
312.1 282.2 281.6 NA NA NA
Wilcoxon rank sum test
data: datachunk[, i] and datachunk[, (i + 1)]
W = 18, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0
X1 X2 X3
161.21 150.01 183.47 201.51 234.70 321.00
X1 X2 X3
501.0 520.1 500.7 NA NA NA
Wilcoxon rank sum test
data: datachunk[, i] and datachunk[, (i + 1)]
W = 0, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0
X1 X2 X3
247.79 159.64 192.00 262.86 403.33 336.21
X1 X2 X3
60.33 66.04 55.23 NA NA NA
Wilcoxon rank sum test
data: datachunk[, i] and datachunk[, (i + 1)]
W = 18, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0
X1 X2 X3
17.12 15.83 16.88 17.61 18.97 45.92
X1 X2 X3
321.8 329.7 334.4 NA NA NA
对于少量观察,测试有点 "chunky" 所以如果你有边界情况(所有第一个参数值都大于第二个参数值,反之亦然)你会得到相同的 p - 全部为 0 或其他数字(取决于 n)的值和 W 统计数据。
要获得更详细的答案,我们需要查看您的数据,或者您需要同意查看我们都可以看到的其他一些数据。
这是一个代码示例,它显示了我正在谈论的行为
i <- 1
datachunk <- mtcars[1:5,]
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)
i <- 2
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)
由于在您的每个测试示例中,一个组中的所有值都大于另一组中的所有值,因此无论实际数值如何,分配给每个差异的带符号排名都是相同的。因此,您的测试统计数据和 p 值都是相同的。
所以在数学上它是有道理的,但我会考虑在这么小的样本量下测试的应用是否有意义。