使用 Speech to Text 的 MP3 文件的 MIME 类型

MIME type of mp3 file using Speech to Text

我正在使用 Watson 的语音转文本 API。最初我使用的是 .wav 文件,但我想使用 mp3 文件。所以我想知道用于指定内容类型的 mp3 文件的 MIME 类型?

您可以在 official documentation 中看到支持的音频格式是:

  • 音频格式: 转录免费无损音频编解码器 (FLAC),线性 16 位脉冲编码调制 (PCM), 波形音频文件格式 (WAV), Ogg 格式与 Opus 或 Vorbis 编解码器, 网络媒体 (WebM ) 格式与 Opus 或 Vorbis 编解码器、mu-law(或 u-law)音频数据或基本音频。

检查:MIME Types 语音转文本。

使用您的 mp3 音频的一个好主意是在发送之前转换 API。

而且,取决于你想要什么,你可以使用 this 文章。在本文中,Jason 展示了如何使用带有 Asterisk 的 mp3 来发送 Speech to Text 的语音音频。我不确定是否有效。

编辑: [10/2017]

几天前,Watson Speech to Text 发布了一个支持 mp3 输入功能的新版本。

查看现在支持的音频格式:

音频格式:转录免费无损音频编解码器 (FLAC)、MP3(电影专家组或 MPEG)格式、线性16 位脉冲编码调制 (PCM)、波形音频文件格式 (WAV)、使用 Opus 或 Vorbis 编解码器的 Ogg 格式、使用 Opus 或 Vorbis 编解码器的 Web 媒体 (WebM) 格式、mu-law(或 u-law)音频数据和基本音频。