Error: Invalid: Unrecognized filesystem type in URI when loading parquet file from url using arrow package
Error: Invalid: Unrecognized filesystem type in URI when loading parquet file from url using arrow package
我是 parquet 文件格式的新手,我正在使用 read_parquet()
(在 arrow
包中)将 parquet 文件(存储在我的 Dropbox 共享文件夹中)加载到 R 中。但是,我收到以下错误消息
library(arrow)
df <- read_parquet("https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1")
Error: Invalid: Unrecognized filesystem type in URI: https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1
什么可能导致这里出现此问题,我是否需要预先对 url link 进行分区?
arrow
包中的文件读取函数尚不支持 HTTP[S]
URI。我们希望在未来的版本中添加此功能 (ARROW-7594)。与此同时:
如果您在 运行 所在的计算机上安装了 Dropbox,请使用文件的本地路径而不是 HTTPS
URI。
如果您没有安装 Dropbox,请先下载文件,如下所示:
myfile <- tempfile()
download.file(
"https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1",
myfile,
mode = "wb"
)
df <- read_parquet(myfile)
我是 parquet 文件格式的新手,我正在使用 read_parquet()
(在 arrow
包中)将 parquet 文件(存储在我的 Dropbox 共享文件夹中)加载到 R 中。但是,我收到以下错误消息
library(arrow)
df <- read_parquet("https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1")
Error: Invalid: Unrecognized filesystem type in URI: https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1
什么可能导致这里出现此问题,我是否需要预先对 url link 进行分区?
arrow
包中的文件读取函数尚不支持 HTTP[S]
URI。我们希望在未来的版本中添加此功能 (ARROW-7594)。与此同时:
如果您在 运行 所在的计算机上安装了 Dropbox,请使用文件的本地路径而不是 HTTPS
URI。
如果您没有安装 Dropbox,请先下载文件,如下所示:
myfile <- tempfile()
download.file(
"https://www.dropbox.com/s/mysgf4sojpjgyp7/part-394.parquet?dl=1",
myfile,
mode = "wb"
)
df <- read_parquet(myfile)