频繁序列模式

Question

在 R 中获取此类数据的顺序模式的最佳方法是什么：

思路是获取进程1,2,3中字母出现的频率，有没有GSP函数可以做到？任何见解或教程表示赞赏。

Answer 1

您可以使用 apply 和 table 组合（前提是您将数据读入 R）：

dat <- data.frame(process1 = c('A', 'B', 'A', 'A', 'C'), process2 = c('B', 'C', 'B', 'B', 'A'), process3 = c('C', 'C', 'A', 'B', 'B'))
apply(dat, 2, table)
#  process1 process2 process3
#A        3        1        1
#B        1        3        2
#C        1        1        2

apply 遍历 dat 的列（这就是参数 2 所指的）并将 table 应用于每个列，计算每个唯一元素。有关详细信息，请参阅 *apply 函数系列的帮助页面。

d.b 上面的解决方案 lapply(dat, table) 做同样的事情，但是 returns 是列表而不是矩阵。

频繁序列模式

Frequent Sequential Patterns

r

gsp

apriori