Pocketsphinx - 识别过程的调试输出(cmn_prior、fsg_search)是什么意思?

Pocketsphinx - What is the meaning of debug output (cmn_prior, fsg_search) of recognition process?

编辑:因为看起来不清楚,我会把问题说得更具体一些。

pocketsphinx 中的这个数字输出是什么意思?

< INFO: cmn_prior.c(149): cmn_prior_update: to   < 55.55 10.06 -1.22 10.50 -3.09  1.89 -8.37 -9.24 -5.98 -4.85  4.65 -3.25 -3.95 >
< INFO: fsg_search.c(859): 191 frames, 4969 HMMs (26/fr), 12795 senones (66/fr), 1090 history entries (5/fr)

我正在比较不同的运行与几乎相同的 wav 文件并获得略有不同的数字,我对输出的含义感兴趣,以及可以从中获得什么类型的结论或信息。

我找不到任何关于它的文档。我感兴趣的是,更好地理解 pocketsphinx 调试输出。我对模型的内部结构和过程背后的理论有一些想法,但我不知道如何解释这个输出。谢谢!

< INFO: cmn_prior.c(149): cmn_prior_update: to < 55.55 10.06 -1.22 10.50 -3.09 1.89 -8.37 -9.24 -5.98 -4.85 4.65 -3.25 -3.95 >

这一行表明倒谱均值已更新为这些特定值。您可以阅读倒谱均值归一化 here

< INFO: fsg_search.c(859): 191 frames, 4969 HMMs (26/fr), 12795 senones (66/fr), 1090 history entries (5/fr)

此信息与 Viterbi search 有关。它说您的音频有 191 帧。在搜索过程中,有 4969 个 HMM 处于活动状态,评估了 12795 个声学 senone。维特比搜索历史平均每帧包含 5 个条目。

I'm comparing diffent runs with almost identical wav files and obtaining slightly different numbers

如果输入略有不同,也可以看到略有不同的值。

and what type of conclusion or information can be obtained from it.

您无法从您提供的信息中得出任何具体信息。如果数字异常,您可以查找原因。例如,如果 CMN(0) 在 10-60 的通常范围之外为 -200。或者如果有 0 帧。您提供的值是预期的。