如何从 django 视图中实现更快的 tfidfvectorizer 加载时间?

how to achieve faster tfidfvectorizer loading times from within a django view?

我有一个装有 ~120,000 个特征的 TfidfVectorizer,我使用 joblib.dump 保存到文件中。我稍后从 django 视图中加载该模型,使用 joblib.load 但它太慢了(需要 ~2 秒)。提高加载速度的最佳方法是什么?我应该使用 Django 的缓存框架来缓存模型吗?使用 joblib.dump 序列化时是否应该压缩模型?有没有办法将模型加载到内存中一次并保留在那里,而不是每次调用视图时都重新加载它?

模型在请求之间不会改变,因此,我们希望将其加载到内存中一次并保留在那里。这可以在 views.py 中通过加载模型并将其分配给全局变量来实现。