按日期加入数据对象但间隔不同
Join data objects by date but with different intervals
我已经 运行 解决了这个问题,但我真的不知道该怎么做。我有两个 data.frames,都带有日期列。然而,第一个是一个大对象,每 3 秒包含一次测量,而第二个包含每 10 分钟一次的测量。我想通过日期变量将对象 2 的测量变量包含到对象 1(类似于 left_join 或合并)中。我的数据看起来像这样 (df1):
date_time
measurement1
yyyy-mm-dd HH:MM:03
val1
yyyy-mm-dd HH:MM:06
val2
df2:
date_time
measurement2
yyyy-mm-dd HH:10:00
val1
yyyy-mm-dd HH:20:00
val2
我希望这是足够的信息,否则请发表评论。我探索了 foverlapse 和 fuzzyjoin 但没有成功。
提前致谢
以下是我的详细信息 (df1):
date_time
measurement1
05/06/2018 0:00:03
73
05/06/2018 0:00:06
73.5
05/06/2018 0:00:09
48.5
05/06/2018 0:00:12
50.7
05/06/2018 0:00:15
80
05/06/2018 0:00:18
81
数据持续数月每次每3秒一次
df2:
date_time
measurement2
05/06/2018 0:00:00
110
05/06/2018 0:10:00
120
05/06/2018 0:20:00
180
我要的是这个:
df:
date_time
measurement1
measurement2
05/06/2018 0:00:03
73
110
05/06/2018 0:00:06
73.5
110
05/06/2018 0:00:09
48.5
110
05/06/2018 0:00:12
50.7
110
05/06/2018 0:00:15
80
110
05/06/2018 0:00:18
81
110
我希望现在更清楚了,顺便说一句,表格可能有问题,我使用的是 Stack overflow 告诉我的格式,我可以看到在审查中生成的表格,但是格式提交的时候丢失了。
谢谢
如果这些观察每 3 秒发生一次,则每分钟有 20 个观察。因此,每 10 分钟间隔有 200 个观测值。 如果你的数据是完整的,那么你就可以相应地延长你的秒 10 分钟间隔观察,即你复制每 10 分钟间隔值 200 次旁边的 3 -秒间隔值。
尝试以下方法并告诉我你得到了什么
df1$measurement2 <- rep(df2$measurement2, each = 200)
我已经 运行 解决了这个问题,但我真的不知道该怎么做。我有两个 data.frames,都带有日期列。然而,第一个是一个大对象,每 3 秒包含一次测量,而第二个包含每 10 分钟一次的测量。我想通过日期变量将对象 2 的测量变量包含到对象 1(类似于 left_join 或合并)中。我的数据看起来像这样 (df1):
date_time | measurement1 |
---|---|
yyyy-mm-dd HH:MM:03 | val1 |
yyyy-mm-dd HH:MM:06 | val2 |
df2:
date_time | measurement2 |
---|---|
yyyy-mm-dd HH:10:00 | val1 |
yyyy-mm-dd HH:20:00 | val2 |
我希望这是足够的信息,否则请发表评论。我探索了 foverlapse 和 fuzzyjoin 但没有成功。
提前致谢
以下是我的详细信息 (df1):
date_time | measurement1 |
---|---|
05/06/2018 0:00:03 | 73 |
05/06/2018 0:00:06 | 73.5 |
05/06/2018 0:00:09 | 48.5 |
05/06/2018 0:00:12 | 50.7 |
05/06/2018 0:00:15 | 80 |
05/06/2018 0:00:18 | 81 |
数据持续数月每次每3秒一次
df2:
date_time | measurement2 |
---|---|
05/06/2018 0:00:00 | 110 |
05/06/2018 0:10:00 | 120 |
05/06/2018 0:20:00 | 180 |
我要的是这个:
df:
date_time | measurement1 | measurement2 |
---|---|---|
05/06/2018 0:00:03 | 73 | 110 |
05/06/2018 0:00:06 | 73.5 | 110 |
05/06/2018 0:00:09 | 48.5 | 110 |
05/06/2018 0:00:12 | 50.7 | 110 |
05/06/2018 0:00:15 | 80 | 110 |
05/06/2018 0:00:18 | 81 | 110 |
我希望现在更清楚了,顺便说一句,表格可能有问题,我使用的是 Stack overflow 告诉我的格式,我可以看到在审查中生成的表格,但是格式提交的时候丢失了。
谢谢
如果这些观察每 3 秒发生一次,则每分钟有 20 个观察。因此,每 10 分钟间隔有 200 个观测值。 如果你的数据是完整的,那么你就可以相应地延长你的秒 10 分钟间隔观察,即你复制每 10 分钟间隔值 200 次旁边的 3 -秒间隔值。
尝试以下方法并告诉我你得到了什么
df1$measurement2 <- rep(df2$measurement2, each = 200)