使用 R 在 lpp 上测试 CSR

Testing CSR on lpp with R

我最近发布了一个 "very newie to R" 关于正确执行此操作的问题,如果您对此感兴趣,可以在 [此处] 找到它。1

我现在已经设法开发了一个简单的 R 脚本来完成这项工作,但现在的结果让我很烦恼。

长话短说我正在使用 R 分析 lpp(线性点模式)和 mad.test。该函数执行假设检验,其中原假设是点是随机分布的。目前我有 88 个 lpps 需要分析,根据 p.value 其中 86 个是随机分布的,其中 2 个不是。

这是两个非随机分布的 lpp。

看第一个你可以看到某种簇,但第二个只有三个点,在我看来,没有办法保证只有三个点不对应于一个随机的分配。还有其他曲目有 1 点、2 点、3 点,但它们都属于 "random" lpps 类别,所以我不知道为什么这个不同。

那么问题来了:多少分对于CSR测试来说太少了?

我还注意到这两个 lpps 的 $statistic$rank 比其他的要低得多。我试图找到那是什么意思,但我现在一无所知,所以这是另一个新手问题:Is the $statistic$rank some kind of quality analysis indicator, and thus I can use it to group我对 "significant ones" 和 "too little points" 的 lpp 分析?

我的 R 脚本和所有的 shp 文件都可以从 here(850 Kb) 下载。

非常感谢您的帮助。

对于分析需要多少个点的问题,不可能给出一个普遍的答案。通常 0、1 和 2 对于独立分析来说太少了。然而,如果它们是同一事物的重复测量的一部分,它们可能仍然很有趣。另外,我通常会说您的 3 点示例太少,无法说出任何有趣的内容。但是,一个极端的例子是,如果您有一条长线段,其中一个点靠近一端出现,而另外两个点在另一端彼此靠近。对于 CSR,这不太可能发生,您可能倾向于不相信该假设。这似乎是你的情况。

关于您关于排名的问题,您可能需要阅读更多有关您正在进行的 Monte Carlo 测试的内容。基本上,您用一个数字(线性 K 的最大绝对偏差)总结点模式,然后查看这个数字与 CSR 随机生成的数字相比有多极端。假设您使用 99 次 CSR 模拟,您总共有 100 个数字。如果您的数据在这些数据中排名最极端 ($statistic$rank==1),则它的 p 值为 1%。如果它排在第 50 个数字,则 p 值为 50%。如果您使用了其他数量的模拟,则必须进行相应的计算。 IE。 199 次模拟,排名 1 为 0.5%,排名 2 为 1%,等等

多重测试 这里有一个基本问题。您正在应用假设检验 88 次。该测试(默认情况下)设计为在 5%(20 个中有 1 个)的应用程序中给出误报,因此如果零假设为真,您应该预计 88 /20 = 4.4 个误报会发生在您的 88 次测试中。因此,仅获得 2 个正结果 ("non-random") 与所有模式都是随机的原假设完全一致。我的结论是模式是随机的。