通过与预先录制的单词进行比较来识别
Recognition by comparison with pre-recorded words
要求:
我想要一个system/algorithm类似于车内的呼叫系统,你说出你想呼叫的名字,它会发现那个名字与你的声音相匹配。我的要求是我会使用预先录制的声音而不是名字。
例如:
用户为几个非英语单词录制目标语音,例如:
- "Keyboard-JP-01.wav" => 键盘
- "Monitor-JP-01.wav" => 监控
经过一些训练甚至没有训练,当用户再次说出一个词时,语音识别器应该能够识别它是哪个词。
已知工具:
我搜索了现有的语音识别算法,但没有找到,大多数都是识别现有语言(语音到文本的一种)。
它也不同于 phonetic algorithm,后者似乎只适用于英语。
谢谢
Dynamic Time Warping 是这种语音识别的传统且相当简单的算法,但我相信现在一定有更好的方法。
要求:
我想要一个system/algorithm类似于车内的呼叫系统,你说出你想呼叫的名字,它会发现那个名字与你的声音相匹配。我的要求是我会使用预先录制的声音而不是名字。
例如: 用户为几个非英语单词录制目标语音,例如:
- "Keyboard-JP-01.wav" => 键盘
- "Monitor-JP-01.wav" => 监控
经过一些训练甚至没有训练,当用户再次说出一个词时,语音识别器应该能够识别它是哪个词。
已知工具:
我搜索了现有的语音识别算法,但没有找到,大多数都是识别现有语言(语音到文本的一种)。
它也不同于 phonetic algorithm,后者似乎只适用于英语。
谢谢
Dynamic Time Warping 是这种语音识别的传统且相当简单的算法,但我相信现在一定有更好的方法。