训练 MS Custom Speech 模型以识别虚线 ID

Train MS Custom Speech model to recognize dashed ids

我想让我的 Microsoft 自定义语音模型识别包含数字、字符和破折号的指示符,如下所示:12-34 A-56 B78。 语音模型可以正确识别数字和字符。有没有办法训练它以便在我说 "twelve thirtyfour a fiftysix b seventyeight" 时输出字符串 12-34 A-56 B78?我需要这个用于德语语音模型。

我已经尝试使用 10000 随机生成的字符串来训练模型,就像上面的那样。然后我使用相关文本训练模型。

提前致谢

这些是非常具体的格式要求。不幸的是,目前无法从语音服务中获得与此完全相同的结果。我建议对结果进行一些 post 处理,以这种方式格式化它们。