HMM - 正确的状态数

HMM - correct number of states

我是 HMM 的新手。我在维基百科 Baum–Welch_algorithm Example 中遇到了一个例子,我有点困惑。希望可以有人帮帮我。

例子如下:“假设我们有一只鸡,我们每天中午从那里收集鸡蛋。 现在鸡有没有下蛋收集,取决于一些隐藏的未知因素。 然而,我们可以(为简单起见)假设只有两种状态决定鸡是否下蛋。"

我的问题是:

  1. 在我们不知道状态的情况下;我们怎样才能找到正确的状态数。在上面的例子中;他们假设 2。但也许 3 或 5 ...更能代表系统。

  2. 是否需要给系统中的每一个状态赋予意义。在上面的例子中;我们有 s1 和 s2,但没有赋予它们与应用程序相关的含义。

如果您想将 HMM 拟合到您的鸡示例中,您将连续假设只有 1 个状态,然后是 2 个状态,然后是 3 个状态,依此类推。如果你对鸡的生活方式有所了解,你可以根据你的知识来假设状态的数量。

例如,您可以检验两种状态假设,认为一只鸡可能下的蛋的数量取决于以下状态: (1) 鸡醒了,(2) 鸡睡了。

然后您可以用 (1) 鸡醒着,(2) 鸡睡着,(3) 鸡在窝里来检验三态假设。

对于您要测试的每个状态,您都有新的参数添加到您的模型中。他们调整每个状态下的鸡蛋数量,当然还有状态之间的转换概率。然后你可以在你的假设之间选择一个模型,例如基于它对数据的拟合优度(如果你欠一些)和一些信息标准(AIC,BIC,DIC ......取决于你的拟合方法)。