GCP(尤其是AI平台)中的启动盘和数据盘有什么区别

What is the difference between boot disk and data disk in GCP (especially AI platform)

我使用的是GCP的AI平台。创建虚拟机实例时需要选择启动盘和数据盘的大小please see this attached image。

我有 500GB 的数据要在 AI 平台中分析。我应该为启动盘和数据盘选择大于 500GB 的磁盘大小,还是只增加其中一个磁盘大小就足够了(例如,数据磁盘大小为 500GB)?我也不确定启动盘和数据盘之间的不同作用。谢谢。

视情况而定!!

您有专用于启动系统的启动盘。 100Gb 通常足以完成此任务

数据盘可以用来存放你的数据。这取决于您的数据量。

但是,您的数据盘可以存储您的数据,这不是强制性的,这取决于您存储数据的方式。您可以将数据存储在启动盘上。这不是最佳做法,因为在大多数情况下,您可以认为启动磁盘依赖于 VM,而数据则不然。

想象一下这个过程:您创建一个小型 VM,将数据存储在数据磁盘中,然后创建模型和训练循环。完成后,您可以删除您的 VM,创建一个更大的虚拟机(例如使用 GPU)并连接您的数据磁盘。无需重新加载数据、您的模型等,即可使用这个大型 VM 训练您的模型

当您使用 Notebooks API 创建新的 Notebook 实例时,API 将创建一个具有 2 个磁盘的 VM:

  1. OS/libraries/initialization 脚本所在的引导磁盘
  2. 映射到/home/jupyter文件夹的数据盘

这样做的原因是为了支持升级,您可以通过用新的 OS 替换启动磁盘来升级您的 VM,同时保留您的数据。 为了回答你的问题,我会在数据盘中分配space。