根据R中单独数据框中的时间点对时间序列进行分类
Categorize time series based on time points in separate dataframe in R
我有一个间隔为 10 分钟的时间序列,我想根据潮汐阶段(退潮、涨潮)对其进行分类。
理想情况下以例如结束:
date_time tidal_stage
30/05/2016 10:50 low
30/05/2016 11:00 low
30/05/2016 11:10 mid
30/05/2016 11:20 mid
30/05/2016 11:30 mid
30/05/2016 11:40 mid
30/05/2016 11:50 high
30/05/2016 12:00 high
时间序列已经生成使用:
start_time <- as.POSIXct("2016-05-30 10:50:00", tz="CET")
end_time <- as.POSIXct("2016-07-20 08:50:00", tz="CET")
time_seq <- seq(from=start_time, to=end_time, by="10 min")
我有一个单独的数据框 "hw_lw" 包含时间序列中每个日期的低水位和高水位时间:
high_water low_water date
1 2016-05-30 07:39:00 2016-05-30 04:14:00 2016-05-30
2 2016-05-30 20:01:00 2016-05-30 16:35:00 2016-05-30
3 2016-05-31 08:49:00 2016-05-31 05:17:00 2016-05-31
4 2016-05-31 21:14:00 2016-05-31 17:48:00 2016-05-31
5 2016-06-01 10:04:00 2016-06-01 06:30:00 2016-06-01
6 2016-06-01 23:36:00 2016-06-01 19:09:00 2016-06-01
如何将 "tidal_stage" 列添加到时间序列中,每次分类为 "low"、"high" 或 "mid" 潮汐,其中 "low tide" = 低水位前后 1.5 小时; "high tide" = 高水位前后 1.5 小时,并且 "mid tide" = 所有其他点?
我考虑过使用子集,但我只发现了如何在特定时间间隔(例如下午 1 点到下午 2 点之间)之间执行此操作,而不是在向特定时间点(例如 1.5 小时后)添加或减去时间下午 2 点)。
非常感谢任何帮助!谢谢。
首先,您需要更改 hw_dw
数据框的格式,因为您每天有两个低水位和两个高水位:
hw_lw2=data.frame(hw_lw[seq(1,nrow(hw_lw),by=2)],hw_lw[seq(2,nrow(hw_lw),by=2),1:2])
names(hw_lw2)=c("high_water1","low_water1","date","high_water2","low_water2")
向您的第一个数据框 df 添加一个 tidal_stage 列,并将其初始化为 "mid",并在每个数据框中都有一个日期列。
df$tidal_stage=rep("mid",nrow(df))
df$date=as.Date(df$time_date)
hw_lw2$date=as.Date(hw_lw2$date)
然后可以将两个data.frames以日期为key进行left join,找出潮汐阶段:
df2=merge(df,hw_lw2,by="date")
dt=as.difftime(1.5,units="hours")
df2$tidal_stage[(df2$date_time>(df2$low_water1-dt) & df2$date_time<(df2$low_water1+dt)) | (df2$date_time>(df2$low_water2-dt) & df2$date_time<(df2$low_water2+dt))]="low"
df2$tidal_stage[(df2$date_time>(df2$high_water1-dt) & df2$date_time<(df2$high_water1+dt)) | (df2$date_time>(df2$high_water2-dt) & df2$date_time<(df2$high_water2+dt))]="high"
最后您可以删除不需要的列:
df2=subset(df2,select=c("date_time","tidal_stage"))
我有一个间隔为 10 分钟的时间序列,我想根据潮汐阶段(退潮、涨潮)对其进行分类。 理想情况下以例如结束:
date_time tidal_stage
30/05/2016 10:50 low
30/05/2016 11:00 low
30/05/2016 11:10 mid
30/05/2016 11:20 mid
30/05/2016 11:30 mid
30/05/2016 11:40 mid
30/05/2016 11:50 high
30/05/2016 12:00 high
时间序列已经生成使用:
start_time <- as.POSIXct("2016-05-30 10:50:00", tz="CET")
end_time <- as.POSIXct("2016-07-20 08:50:00", tz="CET")
time_seq <- seq(from=start_time, to=end_time, by="10 min")
我有一个单独的数据框 "hw_lw" 包含时间序列中每个日期的低水位和高水位时间:
high_water low_water date
1 2016-05-30 07:39:00 2016-05-30 04:14:00 2016-05-30
2 2016-05-30 20:01:00 2016-05-30 16:35:00 2016-05-30
3 2016-05-31 08:49:00 2016-05-31 05:17:00 2016-05-31
4 2016-05-31 21:14:00 2016-05-31 17:48:00 2016-05-31
5 2016-06-01 10:04:00 2016-06-01 06:30:00 2016-06-01
6 2016-06-01 23:36:00 2016-06-01 19:09:00 2016-06-01
如何将 "tidal_stage" 列添加到时间序列中,每次分类为 "low"、"high" 或 "mid" 潮汐,其中 "low tide" = 低水位前后 1.5 小时; "high tide" = 高水位前后 1.5 小时,并且 "mid tide" = 所有其他点?
我考虑过使用子集,但我只发现了如何在特定时间间隔(例如下午 1 点到下午 2 点之间)之间执行此操作,而不是在向特定时间点(例如 1.5 小时后)添加或减去时间下午 2 点)。
非常感谢任何帮助!谢谢。
首先,您需要更改 hw_dw
数据框的格式,因为您每天有两个低水位和两个高水位:
hw_lw2=data.frame(hw_lw[seq(1,nrow(hw_lw),by=2)],hw_lw[seq(2,nrow(hw_lw),by=2),1:2])
names(hw_lw2)=c("high_water1","low_water1","date","high_water2","low_water2")
向您的第一个数据框 df 添加一个 tidal_stage 列,并将其初始化为 "mid",并在每个数据框中都有一个日期列。
df$tidal_stage=rep("mid",nrow(df))
df$date=as.Date(df$time_date)
hw_lw2$date=as.Date(hw_lw2$date)
然后可以将两个data.frames以日期为key进行left join,找出潮汐阶段:
df2=merge(df,hw_lw2,by="date")
dt=as.difftime(1.5,units="hours")
df2$tidal_stage[(df2$date_time>(df2$low_water1-dt) & df2$date_time<(df2$low_water1+dt)) | (df2$date_time>(df2$low_water2-dt) & df2$date_time<(df2$low_water2+dt))]="low"
df2$tidal_stage[(df2$date_time>(df2$high_water1-dt) & df2$date_time<(df2$high_water1+dt)) | (df2$date_time>(df2$high_water2-dt) & df2$date_time<(df2$high_water2+dt))]="high"
最后您可以删除不需要的列:
df2=subset(df2,select=c("date_time","tidal_stage"))