如何使用 HTML5 音频 API 播放从 XMLHTTPRequest 返回的音频

How do I play audio returned from an XMLHTTPRequest using the HTML5 Audio API

我向服务器端 api 发出 "AJAX" 请求时无法播放音频。

我有后端 Node.js 代码使用 IBM 的 Watson Text-to-Speech 服务从文本提供音频:

var render = function(request, response) {
    var options = {
        text: request.params.text,
        voice: 'VoiceEnUsMichael',
        accept: 'audio/ogg; codecs=opus'
    };

    synthesizeAndRender(options, request, response);
};

var synthesizeAndRender = function(options, request, response) {
    var synthesizedSpeech = textToSpeech.synthesize(options);

    synthesizedSpeech.on('response', function(eventResponse) {
        if(request.params.text.download) {
            var contentDisposition = 'attachment; filename=transcript.ogg';

            eventResponse.headers['content-disposition'] = contentDisposition;
        }
    });

    synthesizedSpeech.pipe(response);
};

我有客户端代码来处理:

var xhr = new XMLHttpRequest(),
    audioContext = new AudioContext(),
    source = audioContext.createBufferSource();

module.controllers.TextToSpeechController = {
    fetch: function() {
        xhr.onload = function() {
            var playAudio = function(buffer) {
                source.buffer = buffer;
                source.connect(audioContext.destination);

                source.start(0);
            };

            // TODO: Handle properly (exiquio)
            // NOTE: error is being received
            var handleError = function(error) {
                console.log('An audio decoding error occurred');
            }

            audioContext
                .decodeAudioData(xhr.response, playAudio, handleError);
        };
        xhr.onerror = function() { console.log('An error occurred'); };

        var urlBase = 'http://localhost:3001/api/v1/text_to_speech/';
        var url = [
            urlBase,
            'test',
        ].join('');

        xhr.open('GET', encodeURI(url), true);
        xhr.setRequestHeader('x-access-token', Application.token);
        xhr.responseType = 'arraybuffer';
        xhr.send();
    }
}

后端 returns 我期望的音频,但从未调用我的成功方法 playAudio。相反,始终调用 handleError 并且错误对象始终为 null。

任何人都可以解释我做错了什么以及如何纠正这个问题吗?将不胜感激。

谢谢。

注意:URL 中的字符串 "test" 成为后端的文本参数,并在 synthesizeAndRender 的选项变量中结束。

不幸的是,与 Chrome 的 HTML5 音频实现不同,Chrome 的网络音频 doesn't support audio/ogg;codecs=opus 是您的请求在此处使用的。您需要将格式设置为 audio/wav 才能正常工作。为了确保它传递给服务器请求,我建议将它放在查询字符串中(accept=audio/wav,urlencoded)。

您只是想播放音频,还是需要访问 Web Audio API 进行音频转换?如果您只需要播放音频,我可以向您展示如何使用 HTML5 音频 API(不是网络音频)轻松播放。对于 HTML5 音频,您可以使用以下技术对其进行流式传输, 您可以使用最佳 audio/ogg;codecs=opus 格式。

就像动态设置音频元素的源一样简单,通过这样的方式从 DOM 查询:

(在HTML)

<audio id="myAudioElement" />

(在你的 JS 中)

var audio = document.getElementById('myAudioElement') || new Audio();
audio.src = yourUrl;

您还可以通过 XMLHttpRequest 设置音频元素的源,但您不会获得流式传输。但是由于您可以使用 POST 方法,因此您不受 GET 请求文本长度的限制(对于此 API,~6KB)。要在 xhr 中设置它,您可以从 blob 响应创建一个数据 uri:

    xhr.open('POST', encodeURI(url), true);
    xhr.setRequestHeader('Content-Type', 'application/json');
    xhr.responseType = 'blob';
    xhr.onload = function(evt) {
      var blob = new Blob([xhr.response], {type: 'audio/ogg'});
      var objectUrl = URL.createObjectURL(blob);
      audio.src = objectUrl;
      // Release resource when it's loaded
      audio.onload = function(evt) {
        URL.revokeObjectURL(objectUrl);
      };
      audio.play();
    };
    var data = JSON.stringify({text: yourTextToSynthesize});
    xhr.send(data);

如您所见,使用XMLHttpRequest,您必须等到数据完全加载才能播放。 可能 是一种使用非常新的媒体源扩展 API 从 XMLHttpRequest 流式传输的方法,目前仅在 Chrome 和 IE 中可用(没有 Firefox 或 Safari ).这是我目前正在试验的一种方法。如果我成功了,我会在这里更新。