为什么response.content可以读取两次而不能解码为json

Why can response.content be read twice and can't be decoded to json

我今天发现了一个奇怪的行为。 我通过 python 请求库在 google 云消息传递中发送了一条消息。 然后我尝试像这样解码对 json 的响应:

response = requests.post(Message_Broker.host, data=json.dumps(payload), headers=headers)
response_results = json.loads(response.content)["results"]

这因解码错误而崩溃:

response_results = json.loads(response.content)["results"]
  File "/usr/local/lib/python2.7/dist-packages/simplejson/__init__.py", line 505, in loads
    return _default_decoder.decode(s)
  File "/usr/local/lib/python2.7/dist-packages/simplejson/decoder.py", line 370, in decode
    obj, end = self.raw_decode(s)
  File "/usr/local/lib/python2.7/dist-packages/simplejson/decoder.py", line 400, in raw_decode
    return self.scan_once(s, idx=_w(s, idx).end())
JSONDecodeError: Expecting value: line 1 column 1 (char 0)

这发生在我的生产系统上,所以我添加了一些调试日志记录以了解响应的实际内容是这样的:

        logger.info("GCM-Response: " + str(response))
        logger.info("GCM-Response: " + response.content)
        logger.info("GCM-Response: " + str(response.headers))

现在真正的奇怪行为发生了。它已正确记录并且不再抛出解码错误。

谁能给我解释一下这种行为?

我也检查过 response.content 实际上是什么:

@property
    def content(self):
        """Content of the response, in bytes."""

        if self._content is False:
            # Read the contents.
            try:
                if self._content_consumed:
                    raise RuntimeError(
                        'The content for this response was already consumed')

                if self.status_code == 0:
                    self._content = None
                else:
                    self._content = bytes().join(self.iter_content(CONTENT_CHUNK_SIZE)) or bytes()

            except AttributeError:
                self._content = None

        self._content_consumed = True
        # don't need to release the connection; that's been handled by urllib3
        # since we exhausted the data.
        return self._content

它是 requests 模型的一部分。不是真正的 属性 但可以通过 @property 装饰器访问。 据我了解,第一次读取日志内容时,_content_consumed 标志设置为 True。因此第二次,当我阅读它进行 json 解码时,它实际上应该引发运行时错误。

是否有解释,只是我在浏览请求文档时没有找到?

Therefore the second time, when I read it for the json decoding it should actually raise the Runtime Error.

不,它不会引发 RuntimeError。当您第一次访问 response.content 时,它会将实际数据缓存到 self._content 中。在第二次(第三次、第四次等)访问 if self._content is False: 是假的,因此您将获得缓存在 self._content.

中的内容

if self._content_consumed: 检查很可能是内部断言,用于发现多次从套接字读取数据的尝试(这显然是一个错误)。


无法解码为 JSON,因为您在响应正文中收到的不是 JSON 或收到的是空正文。可能是500响应,也可能是429响应,没看到实际响应就不好说了。