使用 lubridate 按特定天数过滤
Filtering by a specific number of days using lubridate
我有一个数据集,我想以 10 天为间隔进行分隔。例如,我想将 ID
1 的 26-12-2010
到 04-01-2011
的所有日期放在一起,而不是 ID
1 的接下来的 10 天。我想为每个 ID
执行此操作,并将 10 天的间隔编译成一个列表。
library(lubridate)
date <- rep_len(seq(dmy("26-12-2010"), dmy("20-12-2013"), by = "days"), 500)
ID <- rep(seq(1, 5), 100)
df <- data.frame(date = date,
x = runif(length(date), min = 60000, max = 80000),
y = runif(length(date), min = 800000, max = 900000),
ID)
df %>%
mutate(interval = map(1:50, ~rep(.x, 10)) %>% reduce(c)) %>%
group_split(interval) %>%
map(~arrange(.x, ID)) %>%
map(~ group_split(.x, ID)) %>%
head(2)
)
当使用最后几行代码时,它打破了 days
和 ID
,但是假设在 10 天内的观察结果没有被组合在一起。
我昨天很难理解你想要的输出,但我不知道你为什么不先安排所有 ID
。我希望这就是您要找的:
library(dplyr)
library(magrittr)
# slicing first 2 elements only
df %>%
arrange(ID) %>%
mutate(cut = data.table::rleid(cut(date, breaks = "10 day"))) %>%
group_split(ID, cut) %>%
extract(1:2)
[[1]]
# A tibble: 2 x 5
date x y ID cut
<date> <dbl> <dbl> <int> <int>
1 2010-12-26 73719. 803002. 1 1
2 2010-12-31 66825. 870527. 1 1
[[2]]
# A tibble: 2 x 5
date x y ID cut
<date> <dbl> <dbl> <int> <int>
1 2011-01-05 63023. 807545. 1 2
2 2011-01-10 76356. 875837. 1 2
我有一个数据集,我想以 10 天为间隔进行分隔。例如,我想将 ID
1 的 26-12-2010
到 04-01-2011
的所有日期放在一起,而不是 ID
1 的接下来的 10 天。我想为每个 ID
执行此操作,并将 10 天的间隔编译成一个列表。
library(lubridate)
date <- rep_len(seq(dmy("26-12-2010"), dmy("20-12-2013"), by = "days"), 500)
ID <- rep(seq(1, 5), 100)
df <- data.frame(date = date,
x = runif(length(date), min = 60000, max = 80000),
y = runif(length(date), min = 800000, max = 900000),
ID)
df %>%
mutate(interval = map(1:50, ~rep(.x, 10)) %>% reduce(c)) %>%
group_split(interval) %>%
map(~arrange(.x, ID)) %>%
map(~ group_split(.x, ID)) %>%
head(2)
)
当使用最后几行代码时,它打破了 days
和 ID
,但是假设在 10 天内的观察结果没有被组合在一起。
我昨天很难理解你想要的输出,但我不知道你为什么不先安排所有 ID
。我希望这就是您要找的:
library(dplyr)
library(magrittr)
# slicing first 2 elements only
df %>%
arrange(ID) %>%
mutate(cut = data.table::rleid(cut(date, breaks = "10 day"))) %>%
group_split(ID, cut) %>%
extract(1:2)
[[1]]
# A tibble: 2 x 5
date x y ID cut
<date> <dbl> <dbl> <int> <int>
1 2010-12-26 73719. 803002. 1 1
2 2010-12-31 66825. 870527. 1 1
[[2]]
# A tibble: 2 x 5
date x y ID cut
<date> <dbl> <dbl> <int> <int>
1 2011-01-05 63023. 807545. 1 2
2 2011-01-10 76356. 875837. 1 2