将当前值与以前的值进行比较

Question

再次回到纸面上的一个简单问题，但在实施过程中遇到困难。对于上下文，这是在查看嫌疑人和受害者，我们想要实现的是当前受害者是否与上一个受害者相同。如果是这样，则怀疑最新的受害者与我们希望标记并保留的最后一个条目不同。如果它们相同，我们将删除记录。

所以比较是：

日期 1 的嫌疑人 A 与受害人 1 相关 = 日期 2 的嫌疑人 A 与受害人 1 相关 = Drop

日期 1 的嫌疑人 B 与受害人 2 有关 = 日期 2 的嫌疑人 B 与受害人 3 有关 = 保留

Date	Suspect	Victim
15/01/2022	A	1
12/03/2022	A	1
19/02/2022	B	2
16/01/2022	B	3
08/03/2022	B	4
20/03/2022	B	5
25/01/2022	C	5
21/02/2022	D	6
10/01/2022	D	7

假设这是我当前的数据集。在这种情况下 'Suspect' 应该只有两个条目 B 和 D，而 A 和 C 被删除。

我正在考虑安排约会和嫌疑人。然后比较滞后。但是如果跳跃嫌疑人，滞后是如何工作的。可以用组变量解决吗？这就是我坚持概念化它并害怕删除应该包括的东西的地方。

一如既往的帮助，我们将不胜感激。

Answer 1

试试这个：

dat %>%
  group_by(Suspect) %>%
  filter(n() > 1 & Victim != last(Victim))
# # A tibble: 4 x 3
# # Groups:   Suspect [2]
#   Date       Suspect Victim
#   <chr>      <chr>    <int>
# 1 19/02/2022 B            2
# 2 16/01/2022 B            3
# 3 08/03/2022 B            4
# 4 21/02/2022 D            6

将当前值与以前的值进行比较

Comparing Current Against Previous Values

r

dplyr