为什么 testthat 2.3.2 使用不同的 sort()

Why does testthat 2.3.2 use a different sort()

(在 Github here 也有人问过这个问题)

将 R 升级到 4.0.2 后测试失败,因为 testthatsort 的算法似乎发生了变化。下面显示,base::sort()browser() 在 R 4.0.2 中很好(参见 问题,为什么要添加此检查。):

y <- c("Schaffhausen", "Schwyz", "Seespital", "SRZ")
print(sort(y))
# [1] "Schaffhausen" "Schwyz"       "Seespital"    "SRZ"
browser()
print(sort(y))
# [1] "Schaffhausen" "Schwyz"       "Seespital"    "SRZ"

但是如果您创建一个包,将其命名为 testsort,使用 usethis::use_testthat() 添加测试环境并在 /testsort/tests/testthat/ 中添加一个文件“test-sort.R”

test_that("test sort", {
  xx <- c("Schaffhausen", "Schwyz", "Seespital", "SRZ")
  print("")
  # bowser()
  print(sort(xx))
  expect_equal(sort(xx), c("Schaffhausen", "Schwyz", "Seespital", "SRZ"))
})

你得到

==> devtools::test()

Loading testsort
Testing testsort
v |  OK F W S | Context
/ |   0       | sort[1] ""
[1] "SRZ"          "Schaffhausen" "Schwyz"       "Seespital"   
v |   1       | sort

== Results =============================================================================
OK:       1
Failed:   0
Warnings: 0
Skipped:  0

我在 RStudio 控制台(!)中使用了 debug(sort)devtools::test(),但无法弄清楚会发生什么。

R.version
platform       x86_64-w64-mingw32          
arch           x86_64                      
os             mingw32                     
system         x86_64, mingw32             
status                                     
major          4                           
minor          0.2                         
year           2020                        
month          06                          
day            22                          
svn rev        78730                       
language       R                           
version.string R version 4.0.2 (2020-06-22)
nickname       Taking Off Again   

目前testthat2.3.2是最新的,也就是testthat没有更新的版本。

感谢来自test的@Ulugbek Umirov:

10.5 CRAN notes

CRAN will run your tests on all CRAN platforms: Windows, Mac, Linux and Solaris. There are a few things to bear in mind:

Note that tests are always run in the English language (LANGUAGE=EN) and with C sort order (LC_COLLATE=C). This minimises spurious differences between platforms.

Cross-platform 重现性更重要。将排序规则设置为 C 可确保测试在所有平台上给出相同的结果。


如果 sort 导致问题,则处理此更改的选项(排序取决于排序规则)**您至少有 3 个不同的选项:

  1. stringr::sort()的使用:新增对stringr包的依赖

  2. 自定义您的函数,无需额外的包

    myfun <- function(my_collation = "German_Switzerland.1252", ...) {
      my_locale <- Sys.getlocale("LC_COLLATE")
      on.exit(expr = Sys.setlocale("LC_COLLATE", my_locale))
    
      Sys.setlocale("LC_COLLATE", my_collation)
      r <- sort(...)
      return(r)
    }
    

    由于on.exit()

    ,没有使用新包
  3. 使用 withr-Package 处理 on.exit 部分

    myfun <- function(my_collation = "German_Switzerland.1252", …) {
      withr::local_collate(my_collation)
    
      r <- sort(…)
      return(r)
    }