通过与预先录制的单词进行比较来识别

Recognition by comparison with pre-recorded words

要求：

我想要一个system/algorithm类似于车内的呼叫系统，你说出你想呼叫的名字，它会发现那个名字与你的声音相匹配。我的要求是我会使用预先录制的声音而不是名字。

例如：用户为几个非英语单词录制目标语音，例如：

经过一些训练甚至没有训练，当用户再次说出一个词时，语音识别器应该能够识别它是哪个词。

已知工具：

我搜索了现有的语音识别算法，但没有找到，大多数都是识别现有语言（语音到文本的一种）。

它也不同于 phonetic algorithm，后者似乎只适用于英语。

谢谢

Dynamic Time Warping 是这种语音识别的传统且相当简单的算法，但我相信现在一定有更好的方法。