会话对象上的 Flask Session(文件系统)UnPicklingError,是否有大小限制或我是否会损坏?

Flask Session (filesystem) UnPicklingError on session objects, is there a size limitation or am I getting corruptions?

Python2.7 / Centos7.5 / Apache2.4.6 + mod_wsgi

我正在使用 flask/jinja 生成一些交互式 html 表单并将数据保存到更改之间的会话文件 (flask_session / type=filesystem)。它在 werkzeug 的 contrib/cache.py 的 _prune 函数期间随机中断并出现 Unpickling 错误,我不知道为什么。删除会话文件将解决问题,直到它再次出现。从那以后,我已经能够通过强制会话文件的大小增加(使表单更长)来重现错误,所以我怀疑大小是相关的,但它并不能完全解释为什么它们首先发生. 我 运行 喜欢的服务器端会话文件/泡菜是否有一些大小限制? 这不是完全可以预测的,我只知道当我开始超载时它最终会发生。据我所知,除了 jinja-rendered html.

之外,没有任何内容被发送到客户端

我加载了一个大小合适的 OrderedDict 作为会话项:

session['saved'] = OrderedDict(items_list)

字典的深度只有3层,总共有~300个键,有崩溃的风险。

我尝试过更改会话项目阈值、更改会话文件的永久性、更新 werkzeug,并且我有一个解决方法,即在 UnpicklingError 上强制删除会话文件(这似乎不会影响客户端体验)。但这是对 werkzeug lib 文件的手动编辑,绝对不是一个长期的解决方案。

Traceback (most recent call last):
File "/usr/lib64/python2.7/site-packages/flask/app.py", line 2292, in wsgi_app
  response = self.full_dispatch_request()
File "/usr/lib64/python2.7/site-packages/flask/app.py", line 1816, in full_dispatch_request
  return self.finalize_request(rv)
File "/usr/lib64/python2.7/site-packages/flask/app.py", line 1833, in finalize_request
  response = self.process_response(response)
File "/usr/lib64/python2.7/site-packages/flask/app.py", line 2114, in process_response
  self.session_interface.save_session(self, ctx.session, response)
File "/usr/lib64/python2.7/site-packages/flask_session/sessions.py", line 355, in save_session
  total_seconds(app.permanent_session_lifetime))
File "/usr/lib/python2.7/site-packages/werkzeug/contrib/cache.py", line 815, in set
  self._prune()
File "/usr/lib/python2.7/site-packages/werkzeug/contrib/cache.py", line 764, in _prune
  expires = pickle.load(f)
UnpicklingError: invalid load key, '*'.

相关 python 代码(为了便于阅读而进行了修剪和修改):

from flask import Flask, session, request, render_template
from flask_session import Session
from collections import OrderedDict
app = Flask(__name__)
SESSION_TYPE = app.config['SESSION_TYPE'] = 'filesystem'
SESSION_FILE_DIR = app.config['SESSION_FILE_DIR'] = os.path.join(local_dir,'flask_session')
SESSION_FILE_THRESHOLD = app.config['SESSION_FILE_THRESHOLD'] = 100
Session.init_app(app)

@app.route('/', defaults={'path': ''}, methods=['POST','GET'])
@app.route('/<path:path>', methods=['POST','GET'])
def configuration(path):
    #Do Some Stuff
    session['saved'] = OrderedDict(items_list)
    return render_template('configuration.html', session=session)

相关神社

% for element, details in session.saved.items()
    <tr id="{{element}}" name="{{details['type']}}">
            <td>
        <select id="{{element}}" name="{{element}}">
            % for item, desc in details["items"]
                <option value="{{item}}">{{desc}}</option>
            % endfor
        </select>
        </td>
        </tr>
为方便起见,来自 werkzeug/contrib/cache.py 的

_prune 函数

 def _prune(self):
        if self._threshold == 0 or not self._file_count > self._threshold:
            return

        entries = self._list_dir()
        now = time()
        for idx, fname in enumerate(entries):
            try:
                remove = False
                with open(fname, "rb") as f:
                    expires = pickle.load(f)
                remove = (expires != 0 and expires <= now) or idx % 3 == 0

                if remove:
                    os.remove(fname)
            except (IOError, OSError):
                pass
# Add Exception to delete file with pickle errors
            except pickle.UnpicklingError:
                os.remove(fname)
        self._update_count(value=len(self._list_dir()))

我不认为它是相关的,考虑到它应该都是服务器端的,但是 运行 带有烧瓶开发服务器的 Windows 环境中的相同脚本不存在 pickling错误。相反,我在 self.flush() 中收到套接字错误 - 已建立的连接被主机中的软件中止。也没有崩溃,它只是继续。我怀疑这只是错误处理,但认为值得一提。

事实证明,flask_session 目录中还有另一个文件 werkzeug/contrib/cache 正在尝试加载并检查它是否需要修剪:

.gitignore

*脸掌*

这里的答案是,不,这不是大小限制,也不存在腐败。该库试图纯粹根据目录内容来修剪文件。

这是文件系统的行为,它会降低应用程序的速度,最好使用 Redis 或某种缓存数据库系统。

app.config['SESSION_TYPE'] = 'redis'