requests.Session() 从 CookieJar 加载 cookie

requests.Session() load cookies from CookieJar

如何将 CookieJar 加载到新的 requests.Session 对象?

cj = cookielib.MozillaCookieJar("mycookies.txt")
s = requests.Session()

这是我创建的,现在会话将存储 cookie,但我希望它从文件
(会话应加载 cookieJar)中获取我的 cookie。 如何实现?
我搜索了文档,但只能找到代码示例,它们从不加载 cookieJar,只是在一个会话期间保存 cookie。

可以为 requests.Session(以及请求)对象提供一个可选的 cookies=

cookies = None

A CookieJar containing all currently outstanding cookies set on this session. By default it is a RequestsCookieJar, but may be any other cookielib.CookieJar compatible object.

参见:https://2.python-requests.org/en/latest/api/#requests.Session.cookies

所以变成:

s = requests.Session(cookies=cj)

更新:我混淆了 requests.getrequest.post 等...,正如 mata 在评论中正确指出的那样- cookies 是会话对象的一个​​属性,不是初始化参数,所以这是行不通的。 s.cookies = cj 构建会话后将:

因此,使用:

s = requests.Session()
s.cookies = cj

在Python3.x

import requests
import http.cookiejar

s = requests.Session()
s.cookies = http.cookiejar.MozillaCookieJar("anything.txt")

例如,我将访问 google 站点并将 cookiejar 保存到文件“anything.txt”

s.get("https://google.com")
s.cookies.save()

以后,我会用我的 cookiejar 再次访问 google。

s.cookies.load()
s.get("https://google.com")

Python 3.x 代码,完整的工作和良好实施的例子。代码不言自明。

此代码正确处理 "session cookies",在运行之间保留它们。默认情况下,这些不会保存到磁盘,这意味着大多数网站会要求您在运行之间不断登录。但是使用下面的技术,所有会话 cookie 也被保留了!

这就是您要查找的代码。

import os
import pathlib
import requests
from http.cookiejar import MozillaCookieJar


cookiesFile = str(pathlib.Path(__file__).parent.absolute() / "cookies.txt")  # Places "cookies.txt" next to the script file.
cj = MozillaCookieJar(cookiesFile)
if os.path.exists(cookiesFile):  # Only attempt to load if the cookie file exists.
    cj.load(ignore_discard=True, ignore_expires=True)  # Loads session cookies too (expirydate=0).

s = requests.Session()
s.headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36",
    "Accept-Language": "en-US,en"
}
s.cookies = cj  # Tell Requests session to use the cookiejar.

# DO STUFF HERE WHICH REQUIRES THE PERSISTENT COOKIES...
s.get("https://www.somewebsite.com/")

cj.save(ignore_discard=True, ignore_expires=True)  # Saves session cookies too (expirydate=0).