提高从 R 中的 Rest Api 中提取数据的速度
Increase the speed of pulling data from a Rest Api in R
我正在使用 R 从 API 中提取数据,我想知道是否可以加快调用速度。通常在提取数据后,我必须使用一些其他函数来获得所需的输出。这通常会大大降低我的代码速度。
这是一个可重现的示例:(api 密钥作为免费密钥使用)
library(httr)
library(jsonlite)
data = GET("https://finnhub.io/api/v1/stock/candle?symbol=AAPL&resolution=1&from=1572651390&to=1572910590&token=btj392748v6p9f1po5vg")
value = data$content
value = rawToChar(value)
value = fromJSON(value)
head(value$c, 10)
#[1] 257.57 257.07 257.14 257.37 257.57 257.66
有没有办法加快我从服务器调用的速度?我发现我必须对许多 api 连接的人执行此操作。速度对我很重要。如果您能提出更好的方法,我们将不胜感激。
@dave2e 有一个很好的想法 - 只需调用 fromJson("url goes here").
但是,一些 api 的呼叫需要 header。这就是我通常用 GET() 调用它的方式。
token = "mysecretpassword"
value = GET(url, add_headers(Authorization = token))
我如何在 fromJson() 中执行此操作?
您不控制下载或远程服务器。但是你控制 JSON 转换,没有什么比 simdjson which you can use via RcppSimdJson.
更快
代码
library(httr)
library(jsonlite)
library(RcppSimdJson)
library(rbenchmark)
data <- GET("https://finnhub.io/api/v1/stock/candle?symbol=AAPL&resolution=1&from=1572651390&to=1572910590&token=btj392748v6p9f1po5vg")
benchmark(value1 <- fromJSON(rawToChar(data$content)),
value2 <- RcppSimdJson::fparse(data$content),
replications=1000[,1:4]
输出
R> library(httr)
R> library(jsonlite)
R> library(RcppSimdJson)
R> library(rbenchmark)
R> data <- GET("https://finnhub.io/api/v1/stock/candle?symbol=AAPL&resolution=1&from=1572651390&to=1572910590&token=btj392748v6p9f1po5vg")
R> benchmark(value1 <- fromJSON(rawToChar(data$content)),
+ value2 <- RcppSimdJson::fparse(data$content), replications=1000)[,1:4]
test replications elapsed relative
1 value1 <- fromJSON(rawToChar(data$content)) 1000 0.987 13.708
2 value2 <- RcppSimdJson::fparse(data$content) 1000 0.072 1.000
R>
因此,转换方面现在快了 13 倍。这在您的整体环境中是否重要只有您可以决定。
我正在使用 R 从 API 中提取数据,我想知道是否可以加快调用速度。通常在提取数据后,我必须使用一些其他函数来获得所需的输出。这通常会大大降低我的代码速度。
这是一个可重现的示例:(api 密钥作为免费密钥使用)
library(httr)
library(jsonlite)
data = GET("https://finnhub.io/api/v1/stock/candle?symbol=AAPL&resolution=1&from=1572651390&to=1572910590&token=btj392748v6p9f1po5vg")
value = data$content
value = rawToChar(value)
value = fromJSON(value)
head(value$c, 10)
#[1] 257.57 257.07 257.14 257.37 257.57 257.66
有没有办法加快我从服务器调用的速度?我发现我必须对许多 api 连接的人执行此操作。速度对我很重要。如果您能提出更好的方法,我们将不胜感激。
@dave2e 有一个很好的想法 - 只需调用 fromJson("url goes here").
但是,一些 api 的呼叫需要 header。这就是我通常用 GET() 调用它的方式。
token = "mysecretpassword"
value = GET(url, add_headers(Authorization = token))
我如何在 fromJson() 中执行此操作?
您不控制下载或远程服务器。但是你控制 JSON 转换,没有什么比 simdjson which you can use via RcppSimdJson.
更快代码
library(httr)
library(jsonlite)
library(RcppSimdJson)
library(rbenchmark)
data <- GET("https://finnhub.io/api/v1/stock/candle?symbol=AAPL&resolution=1&from=1572651390&to=1572910590&token=btj392748v6p9f1po5vg")
benchmark(value1 <- fromJSON(rawToChar(data$content)),
value2 <- RcppSimdJson::fparse(data$content),
replications=1000[,1:4]
输出
R> library(httr)
R> library(jsonlite)
R> library(RcppSimdJson)
R> library(rbenchmark)
R> data <- GET("https://finnhub.io/api/v1/stock/candle?symbol=AAPL&resolution=1&from=1572651390&to=1572910590&token=btj392748v6p9f1po5vg")
R> benchmark(value1 <- fromJSON(rawToChar(data$content)),
+ value2 <- RcppSimdJson::fparse(data$content), replications=1000)[,1:4]
test replications elapsed relative
1 value1 <- fromJSON(rawToChar(data$content)) 1000 0.987 13.708
2 value2 <- RcppSimdJson::fparse(data$content) 1000 0.072 1.000
R>
因此,转换方面现在快了 13 倍。这在您的整体环境中是否重要只有您可以决定。