为 r 中的每个组创建日期序列
creating sequence of dates for each group in r
我有一个如下所示的数据集:
ID created_at
MUM-0001 2014-04-16
MUM-0002 2014-01-14
MUM-0003 2014-04-17
MUM-0004 2014-04-12
MUM-0005 2014-04-18
MUM-0006 2014-04-17
我正在尝试引入新列,该列将是开始日期和定义的最后一天(例如,2015 年 7 月 12 日)之间的所有日期。我在 dplyr
中使用了 seq 函数,但出现错误。
data1 <- data1 %>%
arrange(ID) %>%
group_by(ID) %>%
mutate(date = seq(as.Date(created_at), as.Date('2015-07-12'), by= 1))
我得到的错误是:
Error: incompatible size (453), expecting 1 (the group size) or 1
能否请您提出一些更好的方法来在 R 中执行此任务?
您可以使用 data.table
获取 sequence
从 'created_at' 到 '2015-07-12' 的日期,按 'ID' 列分组。
library(data.table)
setDT(df1)[, list(date=seq(created_at, as.Date('2015-07-12'), by='1 day')) , ID]
如果您需要 dplyr
的选项,请使用 do
library(dplyr)
df1 %>%
group_by(ID) %>%
do( data.frame(., Date= seq(.$created_at,
as.Date('2015-07-12'), by = '1 day')))
如果您有重复的 ID,那么我们可能需要按 row_number()
分组
df1 %>%
group_by(rn=row_number()) %>%
do(data.frame(ID= .$ID, Date= seq(.$created_at,
as.Date('2015-07-12'), by = '1 day'), stringsAsFactors=FALSE))
更新
根据@Frank 的评论,tidyverse
的新习语是
library(tidyverse)
df1 %>%
group_by(ID) %>%
mutate(d = list(seq(created_at, as.Date('2015-07-12'), by='1 day')), created_at = NULL) %>%
unnest()
以data.table
为例
setDT(df1)[, list(date=seq(created_at,
as.Date('2015-07-12'), by = '1 day')), by = 1:nrow(df1)]
数据
df1 <- structure(list(ID = c("MUM-0001", "MUM-0002", "MUM-0003",
"MUM-0004",
"MUM-0005", "MUM-0006"), created_at = structure(c(16176, 16084,
16177, 16172, 16178, 16177), class = "Date")), .Names = c("ID",
"created_at"), row.names = c(NA, -6L), class = "data.frame")
我有一个如下所示的数据集:
ID created_at
MUM-0001 2014-04-16
MUM-0002 2014-01-14
MUM-0003 2014-04-17
MUM-0004 2014-04-12
MUM-0005 2014-04-18
MUM-0006 2014-04-17
我正在尝试引入新列,该列将是开始日期和定义的最后一天(例如,2015 年 7 月 12 日)之间的所有日期。我在 dplyr
中使用了 seq 函数,但出现错误。
data1 <- data1 %>%
arrange(ID) %>%
group_by(ID) %>%
mutate(date = seq(as.Date(created_at), as.Date('2015-07-12'), by= 1))
我得到的错误是:
Error: incompatible size (453), expecting 1 (the group size) or 1
能否请您提出一些更好的方法来在 R 中执行此任务?
您可以使用 data.table
获取 sequence
从 'created_at' 到 '2015-07-12' 的日期,按 'ID' 列分组。
library(data.table)
setDT(df1)[, list(date=seq(created_at, as.Date('2015-07-12'), by='1 day')) , ID]
如果您需要 dplyr
的选项,请使用 do
library(dplyr)
df1 %>%
group_by(ID) %>%
do( data.frame(., Date= seq(.$created_at,
as.Date('2015-07-12'), by = '1 day')))
如果您有重复的 ID,那么我们可能需要按 row_number()
df1 %>%
group_by(rn=row_number()) %>%
do(data.frame(ID= .$ID, Date= seq(.$created_at,
as.Date('2015-07-12'), by = '1 day'), stringsAsFactors=FALSE))
更新
根据@Frank 的评论,tidyverse
的新习语是
library(tidyverse)
df1 %>%
group_by(ID) %>%
mutate(d = list(seq(created_at, as.Date('2015-07-12'), by='1 day')), created_at = NULL) %>%
unnest()
以data.table
为例
setDT(df1)[, list(date=seq(created_at,
as.Date('2015-07-12'), by = '1 day')), by = 1:nrow(df1)]
数据
df1 <- structure(list(ID = c("MUM-0001", "MUM-0002", "MUM-0003",
"MUM-0004",
"MUM-0005", "MUM-0006"), created_at = structure(c(16176, 16084,
16177, 16172, 16178, 16177), class = "Date")), .Names = c("ID",
"created_at"), row.names = c(NA, -6L), class = "data.frame")