Python 请求 - ChunkedEncodingError(e) - requests.iter_lines

Question

我收到 ChunkedEncodingError(e) 使用 Python 请求。我正在使用以下内容来删除 JSON:

r = requests.get(url, headers=auth, stream=True)

并迭代每一行，使用回车 return 作为分隔符，这就是 API 区分不同 JSON 事件的方式。

for d in r.iter_lines(delimiter="\n"):
    d += "\n"
    sock.send(d)

我在马车 return 上定界，然后将其添加回作为端点我将日志推送到实际期望在每个事件结束时也有马车 return。这似乎适用于大约 100k 的日志文件。当我尝试进行更大的调用时，我会抛出以下内容：

for d in r.iter_lines(delimiter="\n"):
logs_1           |   File "/usr/local/lib/python2.7/dist-packages/requests/models.py", line 783, in iter_lines
logs_1           |     for chunk in self.iter_content(chunk_size=chunk_size, decode_unicode=decode_unicode):
logs_1           |   File "/usr/local/lib/python2.7/dist-packages/requests/models.py", line 742, in generate
logs_1           |     raise ChunkedEncodingError(e)
logs_1           | requests.exceptions.ChunkedEncodingError: ('Connection broken: IncompleteRead(0 bytes read)', IncompleteRead(0 bytes read))

更新：我发现 API 有时也会发回 NoneType。那么我如何在不破坏所有内容的情况下在响应中的某个地方解释这个空字节呢？每个单独的事件都以 \n 结束，我需要能够单独检查每个事件。我应该分块内容而不是 iter_lines 吗？然后确保chunk中没有NoneType？这样我就不会尝试 iter_lines 超过 NoneType 而它爆炸了？

Answer 1

ChunkedEncodingError 是由于：httplib.IncompletedRead

import httplib

def patch_http_response_read(func):
    def inner(*args):
        try:
            return func(*args)
        except httplib.IncompleteRead, e:
            return e.partial
    return inner

httplib.HTTPResponse.read = patch_http_response_read(httplib.HTTPResponse.read)

我认为这可能是一个补丁。它允许您处理有缺陷的 HTTP 服务器。

大多数服务器传输所有数据，但由于实施错误，它们错误地关闭会话和 httplib 引发错误并掩埋您宝贵的字节。

Answer 2

正如另一个人 IncompleteRead 提到的，您可以使用 "With" 子句来确保您之前的请求已关闭。

 with requests.request("POST", url_base, json=task, headers=headers) as report:
    print('report: ', report)

Answer 3

如果您跨多个进程（多进程）共享一个 requests.Session 对象，可能会导致此错误。您可以为每个进程创建一个单独的会话 (os.getpid())。

Python 请求 - ChunkedEncodingError(e) - requests.iter_lines

Python Requests - ChunkedEncodingError(e) - requests.iter_lines

python

chunked-encoding

http-chunked

python-requests