通过与预先录制的单词进行比较来识别

Recognition by comparison with pre-recorded words

要求:

我想要一个system/algorithm类似于车内的呼叫系统,你说出你想呼叫的名字,它会发现那个名字与你的声音相匹配。我的要求是我会使用预先录制的声音而不是名字。

例如: 用户为几个非英语单词录制目标语音,例如:

经过一些训练甚至没有训练,当用户再次说出一个词时,语音识别器应该能够识别它是哪个词。

已知工具:

我搜索了现有的语音识别算法,但没有找到,大多数都是识别现有语言(语音到文本的一种)。

它也不同于 phonetic algorithm,后者似乎只适用于英语。

谢谢

Dynamic Time Warping 是这种语音识别的传统且相当简单的算法,但我相信现在一定有更好的方法。