boost::beast 流式 HTTP 的异步处理

Asynchronous processing of streaming HTTP with boost::beast

我正在实现一个访问 REST 端点的客户端,然后开始处理 SSE stream 并在事件发生时监视它们。为此,我将 Boost::Beast 版本 124 与 Boost 1.63 一起使用,并尝试使用 async_read_some 增量读取响应正文。

到目前为止,这是我的代码:

namespace http = boost::beast::http;

http::response_parser<http::string_body> sse_client::m_parser;
http::response<http::string_body> sse_client::m_response;
boost::beast::flat_buffer m_buffer;

void sse_client::monitor_sse()
{
    http::request<http::empty_body> req{http::verb::get, m_target, 11};
    req.set(http::field::host, m_host);
    req.set(http::field::user_agent, BOOST_BEAST_VERSION_STRING);
    req.set(http::field::accept, "text/event-stream");
    http::async_write(m_socket, req,
            std::bind(
                &sse_client::process_sse,
                shared_from_this(),
                std::placeholders::_1,
                std::placeholders::_2));
}

void sse_client::process_sse(boost::system::error_code ec, std::size_t byte_count)
{
    http::read_header(m_socket, m_buffer, m_parser);
    http::async_read_some(m_socket, m_buffer, m_parser,
            std::bind(
                &sse_client::read_event,
                shared_from_this(),
                std::placeholders::_1));
}

void sse_client::read_event(boost::system::error_code ec)
{
    // TODO: process event
    http::async_read_some(m_socket, m_buffer, m_parser,
            std::bind(
                &sse_client::read_event,
                shared_from_this(),
                std::placeholders::_1));
}

我的问题是:

  1. 对于这个特定的用例,这是正确的方法吗?
  2. 是否有比 http::string_body 更适合 response_parserresponse 的类型?
  3. 调用 read_event 处理程序时,它如何访问 async_read_some 检索的内容?是否应该从缓冲区中取出?

我先回答你的问题再解释。

  1. 是的,你想读取 header 然后调用 read_some(或读取,见下文)直到解析器 returns 从 is_complete()。但是,在您的代码中,我注意到您混合了同步和异步调用(read_header 后跟 async_read_some)。最好只使用一种模型而不是混合使用它们。

  2. 出于您的目的,您可能需要 buffer_body 而不是 string_body。文档中有一个示例说明如何执行此操作 (http://www.boost.org/doc/libs/1_66_0/libs/beast/doc/html/beast/using_http/parser_stream_operations/incremental_read.html)

  3. 你说的"buffer"是传递给HTTP流操作的动态缓冲参数。虽然此缓冲区将保存消息数据,但它不供应用程序检查。此缓冲区用于保存流算法可以读取的当前消息末尾之后的附加数据(这在 http://www.boost.org/doc/libs/1_66_0/libs/beast/doc/html/beast/using_http/message_stream_operations.html#beast.using_http.message_stream_operations.reading 中进行了解释)。使用 buffer_body

  4. 时,您将通过检查消息的 body 来访问内容

http::response_parser::get() 将使您能够访问正在读入的消息。

最适合您的解决方案是使用示例中的 buffer_body,提供一个内存区域以指向它,然后在循环中调用 read 或 async_read。每次缓冲区满时,读取将 return 并出现错误 beast::http::error::need_buffer,表明需要进一步调用。

希望对您有所帮助!