将数据帧(或 tibble)转换为 tsibble 的有效方法

Efficient approach(es) to convert a dataframe (or tibble) into a tsibble

我想询问有关将数据帧(或 tibble)转换为 tsibble 的最有效方法的建议。

数据框的第一列有日期,所有其他列代表各种时间序列,其值在相应日期给出。我想有效地创建一个 tsibble 键 = 每个时间序列的名称和索引 = 每个日期。

所以输出将是一个 tsibble,显示如下:

Key                  Index             Value
TimeSeriesOne       FirstDate        Value TimeSeriesOne on first date
TimeSeriesOne       SecondDate       Value TimeSeriesOne on second date
TimeSeriesOne       LastDate         Value TimeSeriesOne on last date
TimeSeriesTwo       FirstDate        Value TimeSeriesTwo on first date
TimeSeriesN         LastDate         Value TimeSeriesN on last date


numRows <- 15
startDate <- lubridate::as_date('2018-06-10')
endDate <- startDate + base::months(x = numRows-1)
theDates <- base::seq.Date(
    from = startDate,
    to = endDate,
    by = "month")  
inputData <- tibble::tibble(
    "Dates" = theDates,
    "SeriesOne" = stats::rnorm(numRows),
    "SeriesTwo" = stats::rnorm(numRows),
    "SeriesThree" = stats::rnorm(numRows), 
    "SeriesFour" = stats::rnorm(numRows))

我们可以使用 data.table 中的 melt 高效地执行此操作,然后将其转换为 tibble

as_tibble(melt(setDT(inputData), id.var = 'Dates', variable.name = 'Key', 
      value.name = 'Value')[, Key := paste0("Time", Key)])

转换为 zoo,然后转换为长数据帧,最后转换为 tsibble


inputData %>%
  read.zoo %>%
  fortify.zoo(melt = TRUE) %>%
  as_tsibble(key = "Series", index = "Index")

或使用 stack(或任何其他重塑函数,包括重塑、融化、聚集、pivot_longer)创建一个长数据框,然后进行 tsibble。如果高效是指最少的先决条件,那么这只使用 tsibble 包及其依赖项。


inputData %>%
  { cbind(.[1], stack(.[-1])) } %>%
  as_tsibble(key = "ind", index = "Dates")

您可以使用 tidyr:

转换为 "long format"
tsibble_input <- tidyr::pivot_longer(inputData, cols = -Dates, names_to = "Key", values_to = "Value") 

并得到 tsibble:

tsibble::as_tsibble(tsibble_input, index = "Dates", key = "Key")