R中的rmse函数问题

rmse function issue in R

我有一个 R 代码,其中包含一些循环的嵌套括号,我在其中使用了 Metrics 包中的 rmse() 函数。我在没有该功能的情况下尝试了它并且它有效,但在我的嵌套 R 代码中它没有。

这是我想用 R

做的
  1. 我生成了一个 50 时间序列数据集。
  2. 我将相同的时间序列数据集分成以下大小的块:2,3,...,48,49 使我从上面的步骤 1 中形成了 48 个不同的时间序列。
  3. 我将每个 48 时间序列数据集分为 traintest 组,这样我就可以使用 Metrics 包中的 rmse 函数来获取均方根误差(RMSE) 对于步骤 2 中形成的 48 个子系列。
  4. 每个系列的 RMSE 然后根据它们的块大小制成表格
  5. 我为每个 48 个不同的时间序列数据集获得了最好的 ARIMA 模型。

我的R代码

 # simulate arima(1,0,0)
 library(forecast)
 library(Metrics)
 n <- 50
 phi <- 0.5
 set.seed(1)
 wn <- rnorm(n, mean=0, sd=1)
    ar1 <- sqrt((wn[1])^2/(1-phi^2))
 for(i in 2:n){
   ar1[i] <- ar1[i - 1] * phi + wn[i]
 }
 ts <- ar1

 t<-length(ts)# the length of the time series
 li <- seq(n-2)+1 # vector of block sizes(i.e to be between 1 and n exclusively)

 RMSEblk<-matrix(nrow = 1, ncol = length(li))#vector to store block means
 colnames(RMSEblk)<-li
 for (b in 1:length(li)){
     l<- li[b]# block size
     m <- ceiling(t / l) # number of blocks
     blk<-split(ts, rep(1:m, each=l, length.out = t)) # divides the series into blocks
     singleblock <- vector() #initialize vector to receive result from for loop
     for(i in 1:10){
         res<-sample(blk, replace=T, 100) # resamples the blocks
         res.unlist<-unlist(res, use.names = F) # unlist the bootstrap series
         # Split the series into train and test set
         train <- head(res.unlist, round(length(res.unlist) * 0.6))
         h <- length(res.unlist) - length(train)
         test <- tail(res.unlist, h)

        # Forecast for train set
        model <- auto.arima(train)
        future <- forecast(test, model=model,h=h)
        nfuture <- as.numeric(out$mean) # makes the `future` object a vector
        # use the `rmse` function from `Metrics` package
        RMSE <- rmse(test, nn)
        singleblock[i] <- RMSE # Assign RMSE value to final result vector element i
    }
    #singleblock
    RMSEblk[b]<-mean(singleblock) #store into matrix
 }
 RMSEblk

我得到的错误

#Error in rmse(test, nn): unused argument (nn)
#Traceback:

但是当我写

library(forecast)

train <- head(ar1, round(length(ar1) * 0.6))
h <- length(ar1) - length(train)
test <- tail(ar1, h)
model <- auto.arima(train)
#forecast <- predict(model, h)
out <- forecast(test, model=model,h=h)
nn <- as.numeric(out$mean)
rmse(test, nn)

确实有效

请指出我遗漏了什么?

在你的 for 循环中做了两个非常小的更正后,我能够 运行 你的代码。看两行注释:

 for (b in 1:length(li)){
     l<- li[b]
     m <- ceiling(t / l)
     blk<-split(ts, rep(1:m, each=l, length.out = t))
     singleblock <- vector()
     for(i in 1:10){
         res<-sample(blk, replace=T, 100)
         res.unlist<-unlist(res, use.names = F)
         train <- head(res.unlist, round(length(res.unlist) * 0.6))
         h <- length(res.unlist) - length(train)
         test <- tail(res.unlist, h)

        model <- auto.arima(train)
        future <- forecast(test, model=model,h=h)
        nfuture <- as.numeric(future$mean) # EDITED: `future` instead of `out`
        RMSE <- rmse(test, nfuture) # EDITED: `nfuture` instead of `nn`
        singleblock[i] <- RMSEi
    }
    RMSEblk[b]<-mean(singleblock)
 }

这些拼写错误可能不会导致错误,因为 nnout 是在全局环境中定义的,而您 运行 for 循环。一个好的调试技巧是重新启动 R 并尝试重现问题。

您的代码没有定义 nn。其他有效的代码有 nn。要从头开始编写代码,请使用此行作为第一个可执行行:

rm(list=ls())