是否可以在 MS Speech-to-Text 中过滤 "interjections"/"humming"?
Is it possible to filter "interjections"/"humming" in MS Speech-to-Text?
我们正在尝试使用(除其他外)Microsoft Speech-to-Text(特别是使用 C# API)转录视频材料。我们从 Microsoft 获得的结果通常包含很多 "interjections"/"humming"(此处不确定正确的术语),例如 "hmm"、"uhm" 等,而其他提供商似乎会自动过滤掉这些内容。在某些情况下,将这些包含在结果中可能很有意义,但在其他设置中,如果有一种方法可以配置 SpeechRecognizer 以排除它们,那就太好了。有办法实现吗?
我们的后端引擎有这个能力。
但是,它目前没有公开记录,我不确定您将如何将此选择从客户端发送到服务。现在它是某些端点而非其他端点的默认设置("internet search" 与 "dictation" 相对应)。
我将不得不与我们的一位服务工程师交谈,看看是否可以从客户端动态更改此设置,并以更好的响应回复您。
谢谢,
布莱恩.
---更新---
我与我们的一位服务工程师交谈过,该功能称为 TrueText 格式。我对我们的测试和文档做了一些挖掘,它实际上公开记录在这里。
如何在 SpeechConfig 对象上 call/set 的示例如下...
var trueText = "TrueText";
myDefaultConfig.SetProperty(PropertyId.SpeechServiceResponse_PostProcessingOption, trueText);
文档目前没有显示其他状态,我认为是 "Normal" 而不是 "TrueText"。我将在本周抽出时间亲自尝试一下,并改进有关此 属性 id.
的文档
我们正在尝试使用(除其他外)Microsoft Speech-to-Text(特别是使用 C# API)转录视频材料。我们从 Microsoft 获得的结果通常包含很多 "interjections"/"humming"(此处不确定正确的术语),例如 "hmm"、"uhm" 等,而其他提供商似乎会自动过滤掉这些内容。在某些情况下,将这些包含在结果中可能很有意义,但在其他设置中,如果有一种方法可以配置 SpeechRecognizer 以排除它们,那就太好了。有办法实现吗?
我们的后端引擎有这个能力。 但是,它目前没有公开记录,我不确定您将如何将此选择从客户端发送到服务。现在它是某些端点而非其他端点的默认设置("internet search" 与 "dictation" 相对应)。
我将不得不与我们的一位服务工程师交谈,看看是否可以从客户端动态更改此设置,并以更好的响应回复您。
谢谢,
布莱恩.
---更新---
我与我们的一位服务工程师交谈过,该功能称为 TrueText 格式。我对我们的测试和文档做了一些挖掘,它实际上公开记录在这里。
如何在 SpeechConfig 对象上 call/set 的示例如下...
var trueText = "TrueText";
myDefaultConfig.SetProperty(PropertyId.SpeechServiceResponse_PostProcessingOption, trueText);
文档目前没有显示其他状态,我认为是 "Normal" 而不是 "TrueText"。我将在本周抽出时间亲自尝试一下,并改进有关此 属性 id.
的文档