为事件日志创建 activity_instance

create activity_instance for Eventlogs

我得到了一个如下所示的 CSV 文件:

我想得到的是:

需要 activity 实例来识别哪些事件属于一起,哪些不属于。这个实例标识符应该是唯一的,在不同的案例和活动中也是如此。 我不知道如何生成这些 ID。 python 中是否有任何图书馆可以处理这个问题?

在 R 中,您可以使用 dplyr.

尝试以下操作

使用 arrange 您可以确保您的数据按 patient 并按时间顺序排列。然后 activity_instance 将是一个数字,当 patientactivity 逐行更改时。

library(dplyr)

df %>%
  arrange(patient, timestamp) %>%
  mutate(activity_instance = 1 + cumsum(
    (patient != lag(patient, default = first(patient)) |
     activity != lag(activity, default = first(activity)))))