德语 Google Assistant SSML 输出中不需要的背景噪音
Unwanted background noise in the German Google Assistant SSML output
我注意到当我输出个位数后跟 <break>
时有背景噪音。我正在使用德语女声 1。我有以下 SSML 标记来重现此行为:
<speak>
<prosody rate="medium">
<s>
<say-as interpret-as="cardinal">0</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">1</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">2</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">3</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">4</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">5</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">6</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">7</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">8</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">9</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">0</say-as>
</s>
</prosody>
</speak>
另外我想提供一个 Link 到 mp3(用 TTS 模拟器生成,德语,女声 1)。您可以清楚地听到噪音,尤其是在数字 0、2、3、4、6、7 之后。这种效果似乎只有在 <say-as interpret-as="cardinal">
之后有 <break>
时才会出现。
我希望这样的 SSML 标记完全没有背景噪音。
我使用上面的标记告诉用户电话号码,因为 <say-as interpret-as="telephone">01234567890</say-as>
拼写数字的速度太快了。
尝试以下操作:
<speak>
<prosody rate="medium">
<s><say-as interpret-as="cardinal">0</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">1</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">2</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">3</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">4</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">5</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">6</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">7</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">8</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">9</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">0</say-as></s>
</prosody>
</speak>
我注意到当我输出个位数后跟 <break>
时有背景噪音。我正在使用德语女声 1。我有以下 SSML 标记来重现此行为:
<speak>
<prosody rate="medium">
<s>
<say-as interpret-as="cardinal">0</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">1</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">2</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">3</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">4</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">5</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">6</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">7</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">8</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">9</say-as><break time="1250ms"/>
<say-as interpret-as="cardinal">0</say-as>
</s>
</prosody>
</speak>
另外我想提供一个 Link 到 mp3(用 TTS 模拟器生成,德语,女声 1)。您可以清楚地听到噪音,尤其是在数字 0、2、3、4、6、7 之后。这种效果似乎只有在 <say-as interpret-as="cardinal">
之后有 <break>
时才会出现。
我希望这样的 SSML 标记完全没有背景噪音。
我使用上面的标记告诉用户电话号码,因为 <say-as interpret-as="telephone">01234567890</say-as>
拼写数字的速度太快了。
尝试以下操作:
<speak>
<prosody rate="medium">
<s><say-as interpret-as="cardinal">0</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">1</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">2</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">3</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">4</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">5</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">6</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">7</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">8</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">9</say-as></s><break time="1250ms"/>
<s><say-as interpret-as="cardinal">0</say-as></s>
</prosody>
</speak>