频繁序列模式
Frequent Sequential Patterns
在 R 中获取此类数据的顺序模式的最佳方法是什么:
思路是获取进程1,2,3中字母出现的频率,有没有GSP函数可以做到?任何见解或教程表示赞赏。
您可以使用 apply
和 table
组合(前提是您将数据读入 R):
dat <- data.frame(process1 = c('A', 'B', 'A', 'A', 'C'), process2 = c('B', 'C', 'B', 'B', 'A'), process3 = c('C', 'C', 'A', 'B', 'B'))
apply(dat, 2, table)
# process1 process2 process3
#A 3 1 1
#B 1 3 2
#C 1 1 2
apply
遍历 dat
的列(这就是参数 2
所指的)并将 table
应用于每个列,计算每个唯一元素。有关详细信息,请参阅 *apply
函数系列的帮助页面。
d.b 上面的解决方案 lapply(dat, table)
做同样的事情,但是 returns 是列表而不是矩阵。
在 R 中获取此类数据的顺序模式的最佳方法是什么:
思路是获取进程1,2,3中字母出现的频率,有没有GSP函数可以做到?任何见解或教程表示赞赏。
您可以使用 apply
和 table
组合(前提是您将数据读入 R):
dat <- data.frame(process1 = c('A', 'B', 'A', 'A', 'C'), process2 = c('B', 'C', 'B', 'B', 'A'), process3 = c('C', 'C', 'A', 'B', 'B'))
apply(dat, 2, table)
# process1 process2 process3
#A 3 1 1
#B 1 3 2
#C 1 1 2
apply
遍历 dat
的列(这就是参数 2
所指的)并将 table
应用于每个列,计算每个唯一元素。有关详细信息,请参阅 *apply
函数系列的帮助页面。
d.b 上面的解决方案 lapply(dat, table)
做同样的事情,但是 returns 是列表而不是矩阵。