为事件日志创建 activity_instance
create activity_instance for Eventlogs
我得到了一个如下所示的 CSV 文件:
我想得到的是:
需要 activity 实例来识别哪些事件属于一起,哪些不属于。这个实例标识符应该是唯一的,在不同的案例和活动中也是如此。
我不知道如何生成这些 ID。 python 中是否有任何图书馆可以处理这个问题?
在 R 中,您可以使用 dplyr
.
尝试以下操作
使用 arrange
您可以确保您的数据按 patient
并按时间顺序排列。然后 activity_instance
将是一个数字,当 patient
或 activity
逐行更改时。
library(dplyr)
df %>%
arrange(patient, timestamp) %>%
mutate(activity_instance = 1 + cumsum(
(patient != lag(patient, default = first(patient)) |
activity != lag(activity, default = first(activity)))))
我得到了一个如下所示的 CSV 文件:
我想得到的是:
需要 activity 实例来识别哪些事件属于一起,哪些不属于。这个实例标识符应该是唯一的,在不同的案例和活动中也是如此。 我不知道如何生成这些 ID。 python 中是否有任何图书馆可以处理这个问题?
在 R 中,您可以使用 dplyr
.
使用 arrange
您可以确保您的数据按 patient
并按时间顺序排列。然后 activity_instance
将是一个数字,当 patient
或 activity
逐行更改时。
library(dplyr)
df %>%
arrange(patient, timestamp) %>%
mutate(activity_instance = 1 + cumsum(
(patient != lag(patient, default = first(patient)) |
activity != lag(activity, default = first(activity)))))