Joblib 持久化和 Pandas

Joblib persistence and Pandas

关于使用内存映射文件在 Joblib 中持久化 Numpy 数组的很好的文档。

在最近的版本中,Joblib 将(显然)以这种方式自动保存和共享 Numpy 数组。

Pandas 数据帧是否也会持久化,或者用户是否需要手动实现持久化?

由于 Pandas 数据帧是建立在 Numpy 数组上的,是的,它们将被持久化。

Joblib 通过连接到 pickle 协议来实现其优化的持久性。任何在其腌制表示中包含 numpy 数组的内容都将受益于 Joblib 的优化。