Wilcoxon 秩和结果：相同的 pvalue 一遍又一遍？

Question

我正在将成对的列数据与 wilcoxon 秩和检验进行比较，并且在大多数比较中我得到了完全相同的 pvalue。我想知道是从数据上判断是我犯了错误还是一切都好。这是一些比较。

这是我用的比较

wtresult<-wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)

这是上面使用的数据的结果。

X1     X2     X3                      
339.53 354.11 435.56 425.34 434.64 436.08 
 X1    X2    X3                   
312.1 282.2 281.6    NA    NA    NA 

Wilcoxon rank sum test

data:  datachunk[, i] and datachunk[, (i + 1)]
W = 18, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0

X1     X2     X3                      
161.21 150.01 183.47 201.51 234.70 321.00 
X1    X2    X3                   
501.0 520.1 500.7    NA    NA    NA 

Wilcoxon rank sum test

data:  datachunk[, i] and datachunk[, (i + 1)]
W = 0, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0

X1     X2     X3                      
247.79 159.64 192.00 262.86 403.33 336.21 
X1    X2    X3                   
60.33 66.04 55.23    NA    NA    NA 

Wilcoxon rank sum test

data:  datachunk[, i] and datachunk[, (i + 1)]
 W = 18, p-value = 0.02381
alternative hypothesis: true location shift is not equal to 0

X1    X2    X3                   
17.12 15.83 16.88 17.61 18.97 45.92 
X1    X2    X3                   
321.8 329.7 334.4    NA    NA    NA

Answer 1

对于少量观察，测试有点 "chunky" 所以如果你有边界情况（所有第一个参数值都大于第二个参数值，反之亦然）你会得到相同的 p - 全部为 0 或其他数字（取决于 n）的值和 W 统计数据。

要获得更详细的答案，我们需要查看您的数据，或者您需要同意查看我们都可以看到的其他一些数据。

这是一个代码示例，它显示了我正在谈论的行为

i <- 1
datachunk <- mtcars[1:5,]
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)

i <- 2
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE)

Answer 2

由于在您的每个测试示例中，一个组中的所有值都大于另一组中的所有值，因此无论实际数值如何，分配给每个差异的带符号排名都是相同的。因此，您的测试统计数据和 p 值都是相同的。

所以在数学上它是有道理的，但我会考虑在这么小的样本量下测试的应用是否有意义。

Wilcoxon 秩和结果：相同的 pvalue 一遍又一遍？

Wilcoxon rank sum results: same pvalue over and over?

statistics

r

significance