将 6GB SPSS (.dta) 数据集读入 R
Reading in 6GB SPSS (.dta) dataset into R
我的 iMac(OS:Catalina 10.15.4)处理器(3.1 GHz)上有一个 6.1 GB 的大数据文件我尝试了多种读取文件的方法进入我的 R 全局环境。
library(foreign)
data <- read.dta(file = "File.dta", missing.type = TRUE)
install.packages("readstata13")
library(readstata13)
data <- read.dta13(file = "File.dta")
library(haven)
data <- read_dta('File.dta')
library(memisc)
data <- as.data.frame(file = "File.dta")
每种方式我都得到一个错误:
错误:矢量内存耗尽(达到限制?)
我尝试使用以下代码来增加我使用的内存来解决这个问题:
memory.limit(size = 12000) #This is a Windows only command
Sys.setenv('R_MAX_VSIZE'=32000000000)
options(scipen = 999)
但是 none 已经奏效了。
有没有人遇到过 Mac 的这个问题并且能够解决这个问题?
最好的方法是只读取选定的数据列:
data <- read_dta("032720.dta", col_select=c("WP5AA","YEAR_WAVE", "WP16", "WP18", "WP23",
"WP2319", "INCOME_5", "WP119",
"WP5358", "WP128", "EMP_2010",
"WP1219", "WP1220", "WP1223", "WP1230",
"WP1233Recoded", "income_2", "WP3117", "WP60", "WP63", "WP67"))
我的 iMac(OS:Catalina 10.15.4)处理器(3.1 GHz)上有一个 6.1 GB 的大数据文件我尝试了多种读取文件的方法进入我的 R 全局环境。
library(foreign)
data <- read.dta(file = "File.dta", missing.type = TRUE)
install.packages("readstata13")
library(readstata13)
data <- read.dta13(file = "File.dta")
library(haven)
data <- read_dta('File.dta')
library(memisc)
data <- as.data.frame(file = "File.dta")
每种方式我都得到一个错误: 错误:矢量内存耗尽(达到限制?)
我尝试使用以下代码来增加我使用的内存来解决这个问题:
memory.limit(size = 12000) #This is a Windows only command
Sys.setenv('R_MAX_VSIZE'=32000000000)
options(scipen = 999)
但是 none 已经奏效了。
有没有人遇到过 Mac 的这个问题并且能够解决这个问题?
最好的方法是只读取选定的数据列:
data <- read_dta("032720.dta", col_select=c("WP5AA","YEAR_WAVE", "WP16", "WP18", "WP23",
"WP2319", "INCOME_5", "WP119",
"WP5358", "WP128", "EMP_2010",
"WP1219", "WP1220", "WP1223", "WP1230",
"WP1233Recoded", "income_2", "WP3117", "WP60", "WP63", "WP67"))