为什么TTS(Text-To-Speech)提示在一个环境下测试可以正常播放,而在其他环境下却不能?
Why do TTS (Text-To-Speech) prompts play normally while testing in one environment but not in others?
我是一名软件工程师,在一家使用 TTS 进行电话项目的公司工作。当我打电话来测试我们的 VUI 及其相应的功能和 TTS 提示是否正常工作时,我经常 运行 遇到以下问题。
当我 运行 测试(拨打 phone 电话和导航 VUI)时,在我们的本地环境中,我会随机出现停止播放几秒钟的提示。没有听到提示,而是一片寂静,然后提示在您期望的距离中断开始几秒钟的地方开始。
例如取提示:"Hello, thank you for calling today."
在某些时候,在我们的本地环境中进行测试时,我会听到,例如,"Hello, brief silence calling today."
但是,当我 运行 在我们部署到的环境中进行完全相同的测试时,我听到的提示与我预期的一样。我知道环境问题在 TTS 中很常见,特别是提示切断和播放不清晰,但我很好奇,谁能详细说明这些 "environment problems" 可能是什么?此外,我知道这些问题不是语法问题。我将 运行 测试完美提示提示的地方,但是当我给出无输入或不匹配响应时,点击下一个功能,在那种情况下本质上是完全相同的提示,剪切-关闭/静音发生。
非常感谢任何信息、网站或书籍。我个人还没有在网上找到任何关于这个东西的信息。提前致谢!
TTS - 文本转语音是一个活跃的过程。根据您的平台实现 TTS 的方式,它可能会直接从 TTS 服务器流式传输。可能发生的情况是 TTS 引擎无法满足请求。
如果这是内部部署(现在不太可能),请监控 TTS 服务器的性能。 CPU 是最佳指标。如果平台使用 MRCP(可能)日志进行通信可能会提供见解。
如果这是托管解决方案,请联系您的提供商。奇怪的是,他们的测试环境没有为 TTS 提供足够的配置。主要是因为在测试环境中,其他人都在做同样的事情。在生产中,许多应用程序为了质量而切换到录制的音频,因此减少了 TTS 资源的规模。
对于丑陋的 hack,您可以在所有表格的开头播放 1s 的静音录音(实际音频文件)。这可能会给 TTS 服务器足够的时间来缓冲音频生成。
我是一名软件工程师,在一家使用 TTS 进行电话项目的公司工作。当我打电话来测试我们的 VUI 及其相应的功能和 TTS 提示是否正常工作时,我经常 运行 遇到以下问题。
当我 运行 测试(拨打 phone 电话和导航 VUI)时,在我们的本地环境中,我会随机出现停止播放几秒钟的提示。没有听到提示,而是一片寂静,然后提示在您期望的距离中断开始几秒钟的地方开始。
例如取提示:"Hello, thank you for calling today." 在某些时候,在我们的本地环境中进行测试时,我会听到,例如,"Hello, brief silence calling today."
但是,当我 运行 在我们部署到的环境中进行完全相同的测试时,我听到的提示与我预期的一样。我知道环境问题在 TTS 中很常见,特别是提示切断和播放不清晰,但我很好奇,谁能详细说明这些 "environment problems" 可能是什么?此外,我知道这些问题不是语法问题。我将 运行 测试完美提示提示的地方,但是当我给出无输入或不匹配响应时,点击下一个功能,在那种情况下本质上是完全相同的提示,剪切-关闭/静音发生。
非常感谢任何信息、网站或书籍。我个人还没有在网上找到任何关于这个东西的信息。提前致谢!
TTS - 文本转语音是一个活跃的过程。根据您的平台实现 TTS 的方式,它可能会直接从 TTS 服务器流式传输。可能发生的情况是 TTS 引擎无法满足请求。
如果这是内部部署(现在不太可能),请监控 TTS 服务器的性能。 CPU 是最佳指标。如果平台使用 MRCP(可能)日志进行通信可能会提供见解。
如果这是托管解决方案,请联系您的提供商。奇怪的是,他们的测试环境没有为 TTS 提供足够的配置。主要是因为在测试环境中,其他人都在做同样的事情。在生产中,许多应用程序为了质量而切换到录制的音频,因此减少了 TTS 资源的规模。
对于丑陋的 hack,您可以在所有表格的开头播放 1s 的静音录音(实际音频文件)。这可能会给 TTS 服务器足够的时间来缓冲音频生成。