从 URL(Dropbox 文件夹)将多个镶木地板文件加载到 R
Loading multiple parquet files into R from URL (Dropbox folder)
我正在尝试从我的 Dropbox 文件夹的 URL 加载多个镶木地板文件(我没有将这些文件设置为本地只是为了节省我的计算机内存)。我使用了以下代码,但它 returns 什么都没有。
library(arrow)
library(dplyr)
files <- list.files(path = "https://www.dropbox.com/sh/g8ck3t859uahkdi/AADw-kp7EYfU-SMZc4mmtCM2a?dl=1", pattern = "*.parquet", full.names = T)
tbl <- sapply(files, read_parquet, simplify=FALSE) %>%
bind_rows(.id = "id")
我参考了 this and ,但不知道如何参考。
我用 windows 机器来完成这个任务(我需要将 mode
设置为 "wb"
吗?)但如果需要的话可以切换到 Mac。
如果我们使用第二个选项下载到目标文件夹,那么
library(arrow)
library(purrr)
url <- "https://www.dropbox.com/sh/g8ck3t859uahkdi/AADw-kp7EYfU-SMZc4mmtCM2a?dl=1"
filezip <- "/path/to/yourfolder/filenew.zip"
new_folder <- "/path/to/yourfolder/filenew"
download.file(url, filezip, mode = "wb")
unzip(filezip, exdir = new_folder)
files <- list.files(path = new_folder,
pattern = "\.parquet$", full.names = TRUE)
tbl <- map_dfr(files, read_parquet)
nrow(tbl)
#[1] 168019
我正在尝试从我的 Dropbox 文件夹的 URL 加载多个镶木地板文件(我没有将这些文件设置为本地只是为了节省我的计算机内存)。我使用了以下代码,但它 returns 什么都没有。
library(arrow)
library(dplyr)
files <- list.files(path = "https://www.dropbox.com/sh/g8ck3t859uahkdi/AADw-kp7EYfU-SMZc4mmtCM2a?dl=1", pattern = "*.parquet", full.names = T)
tbl <- sapply(files, read_parquet, simplify=FALSE) %>%
bind_rows(.id = "id")
我参考了 this and
我用 windows 机器来完成这个任务(我需要将 mode
设置为 "wb"
吗?)但如果需要的话可以切换到 Mac。
如果我们使用第二个选项下载到目标文件夹,那么
library(arrow)
library(purrr)
url <- "https://www.dropbox.com/sh/g8ck3t859uahkdi/AADw-kp7EYfU-SMZc4mmtCM2a?dl=1"
filezip <- "/path/to/yourfolder/filenew.zip"
new_folder <- "/path/to/yourfolder/filenew"
download.file(url, filezip, mode = "wb")
unzip(filezip, exdir = new_folder)
files <- list.files(path = new_folder,
pattern = "\.parquet$", full.names = TRUE)
tbl <- map_dfr(files, read_parquet)
nrow(tbl)
#[1] 168019