如何从 cmusphinx 的字典中删除单词?
How can I remove words from the dictionary on cmusphinx?
我正在尝试使用西班牙语的 cmusphinx。我下载了西班牙语模型和dict,但是准确度很差...
我试图从 "es.dict" 中删除我需要的所有单词。准确率变为 100%(删除 99% 的单词...)。
但是此更改产生了另一个性能问题,我认为系统正在尝试读取文件 "es-20k.lm" 中的每个单词。
我的输出显示了每个删除的单词:
“2016 年 11 月 12 日 11:05:14 下午 edu.cmu.sphinx.linguist.dictionary.TextDictionary getWord
信息:字典缺少单词 'argumento'"
的音标
如何删除西班牙语模型中未使用的单词?有可能的?
我只想修改这个模型的字典,删除不用的词。
(我现在只想要大约50个字..)。
我正在尝试文档中建议的工具,但我不理解它,或者我不知道如何操作。
谢谢。
你应该保持字典不变。您需要按照 language model tutorial.
的建议,在文本编辑器中编写语法或使用 srilm 构建语言模型
总的来说,减少语言词汇量并不是提高准确率的唯一途径,准确率差的原因通常是噪音、录音条件不匹配等因素。您也需要处理它们。
我正在尝试使用西班牙语的 cmusphinx。我下载了西班牙语模型和dict,但是准确度很差...
我试图从 "es.dict" 中删除我需要的所有单词。准确率变为 100%(删除 99% 的单词...)。
但是此更改产生了另一个性能问题,我认为系统正在尝试读取文件 "es-20k.lm" 中的每个单词。
我的输出显示了每个删除的单词: “2016 年 11 月 12 日 11:05:14 下午 edu.cmu.sphinx.linguist.dictionary.TextDictionary getWord 信息:字典缺少单词 'argumento'"
的音标如何删除西班牙语模型中未使用的单词?有可能的? 我只想修改这个模型的字典,删除不用的词。 (我现在只想要大约50个字..)。
我正在尝试文档中建议的工具,但我不理解它,或者我不知道如何操作。
谢谢。
你应该保持字典不变。您需要按照 language model tutorial.
的建议,在文本编辑器中编写语法或使用 srilm 构建语言模型总的来说,减少语言词汇量并不是提高准确率的唯一途径,准确率差的原因通常是噪音、录音条件不匹配等因素。您也需要处理它们。