写入磁盘的文件会在一段时间后被删除

Files written to disk get deleted after a while

我在 运行 a notebook google 云数据实验室。它生成一些中间输出文件。当 运行 notebook.

时文件显示

然而,几个小时后,当我再次打开笔记本时,只有数据实验室 git 存储库中的文件(主要是笔记本文件)在那里,其他所有内容都被删除了。笔记本内核似乎也重新启动了。

有什么原因吗?我该如何避免这种情况?

Google Cloud Datalab 在 App Engine 托管 VM 环境上运行。这些使用 ephemeral disks 不会在重启之间保留您的数据。

如果出于将来使用或合规原因需要保留中间输出文件,则应使用 Google Cloud Storage, or an other durable mechanism.

保留它们

VM 实例中的存储仅适用于临时的一次性数据。

一个相关问题探讨了永久磁盘的用法: