可变阶马尔可夫链的有效表示

Efficient representation for variable-order Markov Chain

回想一下,(固定顺序)马尔可夫链可以被视为有限状态自动机,其边缘由转移概率标记。

因此,二阶马尔可夫链中的转换可以视为映射

trans2: (State,State) -> List[(State,Float)]

其中浮点值表示与目标状态关联的转移概率。

以明显的方式将其扩展到可变顺序的情况给出:

transN: List[State] -> List[(State,Float)]

但是,为某些输入 List(state1, ..., stateM ) 实现此映射需要在转换 table 中找到所有 LHS 条目,它们是 List 的(不一定正确的)前缀(state1, ..., stateM).

Q. 鉴于状态的数量可能很大,什么可能是一个好的表示?

可变长度马尔可夫链 (VLMC) 的有效表示是概率后缀树 (PST)。例如,请查看有关 PST R-package.

的文章 [1]

[1]:Gabadinho, A. 和 Ritschard, G. (2016)。使用概率后缀树分析状态序列:PST R 包。 统计软件杂志, 72(3), 1-39。 https://www.jstatsoft.org/article/view/v072i03