Microsoft 语音识别结果的格式(挪威语)
Formatting of Microsoft speech recognition results (Norwegian)
在我们正在进行的使用各种语音到文本供应商转录视频材料的实验中,Microsoft 似乎是实际单词识别方面的有力竞争者。对于英文资料,formatting/punctuation也很好,但对于挪威语资料(与我们最相关)几乎没有任何formatting/punctuation。我们正在使用 C# API SpeechRecognizer,config.SpeechRecognitionLanguage 设置为 "nb-NO",config.OutputFormat 设置为 OutputFormat.Detailed,并使用 config.RequestWordLevelTimestamps()。我们可以做些什么来改进结果的格式吗?
另外,在检索单个单词时w/timestamps(这是我们的要求之一),即使是英文资料也没有格式。在检索单个单词时,我们可以设置一些选项来保持 formatting/punctuation 吗?
此致,
贡纳尔
Microsoft 对 nb-NO 结果的语音格式支持目前确实非常基础。显示结果在请求时具有基本的数字格式和明确的标点符号。 Microsoft Speech 正在积极致力于改进自动标点和大写以改进结果。
关于时间戳,目前它不产生显示级别的时间戳。以后可能会支持。
在我们正在进行的使用各种语音到文本供应商转录视频材料的实验中,Microsoft 似乎是实际单词识别方面的有力竞争者。对于英文资料,formatting/punctuation也很好,但对于挪威语资料(与我们最相关)几乎没有任何formatting/punctuation。我们正在使用 C# API SpeechRecognizer,config.SpeechRecognitionLanguage 设置为 "nb-NO",config.OutputFormat 设置为 OutputFormat.Detailed,并使用 config.RequestWordLevelTimestamps()。我们可以做些什么来改进结果的格式吗?
另外,在检索单个单词时w/timestamps(这是我们的要求之一),即使是英文资料也没有格式。在检索单个单词时,我们可以设置一些选项来保持 formatting/punctuation 吗?
此致, 贡纳尔
Microsoft 对 nb-NO 结果的语音格式支持目前确实非常基础。显示结果在请求时具有基本的数字格式和明确的标点符号。 Microsoft Speech 正在积极致力于改进自动标点和大写以改进结果。 关于时间戳,目前它不产生显示级别的时间戳。以后可能会支持。