Python - 请求 - JSONDecodeError

Python - Requests - JSONDecodeError

你好, 运行 Python 中的以下脚本时出现以下错误:

import requests

r = requests.get('https://www.instagram.com/p/CJDxE7Yp5Oj/?__a=1')
data = r.json()['graphql']['shortcode_media']

C:\ProgramData\Anaconda3\envs\test\python.exe C:/Users/Solba/PycharmProjects/test/main.py
追溯(最近一次通话最后一次):
文件“C:/Users/Solba/PycharmProjects/test/main.py”,第 4 行,在
中 数据 = r.json()
文件“C:\ProgramData\Anaconda3\envs\test\lib\site-packages\requests\models.py”,第 900 行,在 json
中 return complexjson.loads(self.text, **kwargs)
文件“C:\ProgramData\Anaconda3\envs\test\lib\json_init_.py”,第 357 行,加载
return _default_decoder.decode(s)
文件“C:\ProgramData\Anaconda3\envs\test\lib\json\decoder.py”,第 337 行,解码
obj, end = self.raw_decode(s, idx=_w(s, 0).end())
文件“C:\ProgramData\Anaconda3\envs\test\lib\json\decoder.py”,第 355 行,在 raw_decode
中 从 None
提高 JSONDecodeError("Expecting value", s, err.value) json.decoder.JSONDecodeError:预期值:第 1 行第 1 列(字符 0)

进程已完成,退出代码为 1


Python版本:3.9
PyCharm版本:2020.3.1
蟒蛇版本:1.10.0


请帮忙。谢谢你

原因是响应没有返回 JSON,而是返回整个 HTML 页面。尝试 r.text 而不是 r.json()...,然后从那里做任何你想做的事情。

如果您不确定内容的类型 returns:

h = requests.head('https://www.instagram.com/p/CJDxE7Yp5Oj/?__a=1')
header = h.headers
contentType = header.get('content-type')
print(contentType)

根据您的 URL,它 returns text/html

或者,您可以尝试在请求中添加 User-Agent - 这是为了模拟请求,使其看起来像是来自浏览器,而不是脚本。

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/46.0.2490.80'
}

r = requests.get('https://www.instagram.com/p/CJDxE7Yp5Oj/?__a=1', headers=headers)
data = r.json()

r.json() 期望 API 返回 JSON 字符串。 API 应该通过响应 headers.

明确表示它正在响应 JSON

在这种情况下,您请求的 URL 要么没有以正确的 JSON 响应,要么没有明确表示它以 JSON.

响应

您可以先检查 URL 发送的回复:

data = r.text
print(data)

如果响应可以被视为 JSON 字符串,那么您可以使用以下方法处理它:

import json
data = json.loads(r.text)

注意: 您还可以检查 content-typeAccept headers 以确保请求和响应是所需的数据类型