频繁序列模式

Frequent Sequential Patterns

在 R 中获取此类数据的顺序模式的最佳方法是什么:

思路是获取进程1,2,3中字母出现的频率,有没有GSP函数可以做到?任何见解或教程表示赞赏。

您可以使用 applytable 组合(前提是您将数据读入 R):

dat <- data.frame(process1 = c('A', 'B', 'A', 'A', 'C'), process2 = c('B', 'C', 'B', 'B', 'A'), process3 = c('C', 'C', 'A', 'B', 'B'))
apply(dat, 2, table)
#  process1 process2 process3
#A        3        1        1
#B        1        3        2
#C        1        1        2

apply 遍历 dat 的列(这就是参数 2 所指的)并将 table 应用于每个列,计算每个唯一元素。有关详细信息,请参阅 *apply 函数系列的帮助页面。

d.b 上面的解决方案 lapply(dat, table) 做同样的事情,但是 returns 是列表而不是矩阵。