您如何使用 boost/beast 从 HTTP POST 请求中解析和提取负载?

How do you use boost/beast to parse and extract the payload from an HTTP POST request?

我想了解如何使用 Boost Beast 库处理 HTTP POST 请求的内容。我稍微修改了 Boost Beast advanced server example 来处理事情。

我在示例中的 handle_request() 方法中添加了以下行(就在第 155 行之前):

    if ( req.method() == http::verb::post)
    {
      std::cout << req << std::endl;
    }

我创建了一个名为 foobar.dat 的简单测试文件,其中包含以下内容:

This is a test!

我使用这个 curl 命令将它发送到服务器:

curl -F 'test=@foobar.dat' http://localhost:8080

这导致服务器输出以下内容:

POST / HTTP/1.1Host: localhost:8080
User-Agent: curl/7.58.0
Accept: */*
Content-Length: 218
Content-Type: multipart/form-data; boundary=------------------------9c747f078ebbe880

--------------------------9c747f078ebbe880
Content-Disposition: form-data; name="test"; filename="foobar.dat"
Content-Type: application/octet-stream

This is a test!

--------------------------9c747f078ebbe880--

所以,我让服务器收到了预期的消息。

如果我将测试稍微修改为以下内容,我可以单独提取 header 字段以及一个大缓冲区中的 body。

    if ( req.method() == http::verb::post)
    {
      std::cout << "Fields:" << std::endl;

      int field_count = 0;
      for(auto const& field : req)
          std::cout << "Field#"
                    << ++field_count << " : " << field.name() << " = " << field.value() << std::endl;

      std::cout << "Body:" << std::endl;
      int body_count = 0;
      for(auto it = boost::asio::buffer_sequence_begin(req.body().data());
          it != boost::asio::buffer_sequence_end(req.body().data()); ++it)
      {
        // This is the next buffer in the sequence
        boost::asio::const_buffer const buffer = *it;

        std::string body(boost::asio::buffer_cast<const char*>(buffer));
        std::cout << "Buffer#" << ++body_count << " = " << body << std::endl;
      }
    }

产生以下输出:

Fields:
Field#1 : Host = localhost:8080
Field#2 : User-Agent = curl/7.58.0
Field#3 : Accept = */*
Field#4 : Content-Length = 218
Field#5 : Content-Type = multipart/form-data; boundary=------------------------5510ea3ec81b8585
Body:
Buffer#1 = --------------------------5510ea3ec81b8585
Content-Disposition: form-data; name="test"; filename="foobar.dat"
Content-Type: application/octet-stream

This is a test!

--------------------------5510ea3ec81b8585--

我找到的大多数示例都演示了如何使用 Boost Beast 创建响应和请求,但我找不到任何明确的示例来说明如何解析内容并分离消息的各个组成部分。

具体来说,我如何使用 Boost Beast 从body 以便进一步处理邮件?或者,此时,是否需要自己解析消息body中的数据?

这超出了 Boost::Beast 的范围。无论您要查找的信息是驻留在字段中还是 body,您都必须自己完成。我建议使用一种方便的字符串操作 tools/utilities/libraries,例如Boost::Algorithm::String 或绕绳下降 (absl::StrSplit)。

旁注:您可以像以前一样访问字段,也可以直接像这样访问字段

auto field = req["<field_name>"];
// or
auto it = req.find("<field_name>");
it->name_string();

HTML 正文中的行由回车符 return 和换行符 \r\n 分隔。 Body 从 headers 乘以双 \r\n。您可以通过编写一个花哨的、优化的解析器或使用一个可用的实用程序来访问单独的行。沿行拆分,沿冒号拆分,沿 semi-colon 拆分以获得对 namefilename 的访问权限,最后沿等号拆分以获取数据。使用 Abseil 的示例,因为我不确定 boost 是否可以沿完整字符串拆分 (string_view):

std::vector<std::string_view> lines = absl::StrSplit(req.body(), "\r\n");
std::vector<std::string_view> headers = absl::StrSplit(line, ':', absl::SkipWhitespace());
// or possibly (never tried it myself but abseil is a great library so I assume this should work)
std::array<std::string_view, 2> headers = absl::StrSplit(line, ':', absl::SkipWhitespace());
std::vector<std::string_view> items = absl::StrSplit(header, ';', absl::SkipWhitespace());
std::vector<std::string_view> values = absl::StrSplit(item, '=', absl::SkipWhitespace());
// or possibly again using array