HTK:通过 phone 优化混合拆分 phone

HTK: Optimizing mixture-splitting phone by phone

我使用 HTK 训练声学模型。我的最后一步是拆分 phone 高斯分布的混合物。通常,我总是将所有phone(它们的内部状态)一步一步拆分,然后重新估计并在性能下降时停止。

现在我想尝试将 phone 一个一个地拆分,因为这应该会导致相同或更好的整体结果。我的做法是,尝试拆分每个 phone,选择导致最佳结果的那个,保持拆分状态,重置所有其他对象,然后重新开始。但这需要很长时间。我想拆分所有带来改进的那些,而不仅仅是最好的,然后进行下一次迭代。

我的问题是:如果拆分 phone 会降低性能,是否有必要在稍后阶段再次拆分它?还是我可以将其列入黑名单并尝试使用在上一次迭代中带来改进的那些?

此类方案的改进通常很小。只需转移到 DNN(顺便说一句,受 HTK 3.5 支持),您可以获得更好的改进。

If splitting a phone lowers the performance, is there any point in trying to split it again at a later stage? Or can I just blacklist it and just try with those that brought an improvement in the last iteration?

你可以加入黑名单