如何读取 .tar.xz 文件?

How do I read an .tar.xz file?

我在这里下载了 Gwern Branwen 数据集:https://www.gwern.net/DNM-archives

我正在尝试读取 R 中的数据集,但遇到了很多麻烦。我试图打开名为“1776.tar.xz”的数据集中的一个文件,我想我 "unzipped" 它是用 untar() 但我什么也没有得到。

untar("C:/User/user/Downloads/dnmarchives/1776.tar.xz",
  files = NULL,
  list = FALSE, exdir = ".",
  compressed = "xz", extras = NULL, verbose = FALSE, restore_times = TRUE,
  tar = Sys.getenv("TAR"))

编辑:感谢到目前为止的所有评论!代码在 base R 中。我有多个从 Gwern 网站下载的数据集。我只是想打开一个来探索。

  1. 在 Debian 或 Ubuntu 上,首先安装包 xz-utils
$ sudo apt-get install xz-utils
  1. 提取 .tar.xz 的方法与提取任何 tar.__ 文件的方法相同。
$ tar -xf file.tar.xz

完成。

Base R 包含函数 untar。我的Ubuntu19.10 运行R 3.6.2,默认安装,以下就够了。

fls <- list.files(pattern = "\.xz")
untar(fls[1], verbose = TRUE)

注.
在问题中,"dataset" 是单数,但该网站上有多个数据集(复数)。下载我使用的文件

args <- "--verbose rsync://78.46.86.149:873/dnmarchives/grams.tar.xz rsync://78.46.86.149:873/dnmarchives/grams-20150714-20160417.tar.xz ./"
cmd <- "rsync"

od <- getwd()
setwd('~/tmp')

system2(cmd, args)

谢谢大家!不确定 r 有什么问题,但我重新安装了。我最终手动解压缩并加载文件。