张量流模型:.data-00000-of-00002 和 data-00001-of-00002 之间有什么区别?
tensorflow model: what is the difference between .data-00000-of-00002 and ,data-00001-of-00002?
在存储tensorflow ckpt时,除了.index、.meta和checkpoint文件外,还会同时保存两个“.data”文件:.data-00000-of-00002和.data-00001-的-00002。前者的尺寸远小于后者。我的问题是,为什么保存了两个数据文件,它们之间有什么区别?
根据tensorflow官方page:
一个或多个分片 (<prefix>-<global_step>.data-<shard_index>-of-<number_of_shards>
) 包含模型的权重,索引文件包含哪些权重存储在哪个分片中。分片的数量取决于您使用多少台机器进行训练。
因此,如果您在两台机器上训练一个模型,您将有两个后缀为 .data-00000-of-00002
和 .data-00001-of-00002
的分片
您可能也想看看 this url。
实例化tf.train.Saver
时,您可以设置参数sharded
的值(默认值为False
)。 sharded=True
指示 Saver 为每个 machine/device.
分片检查点
在存储tensorflow ckpt时,除了.index、.meta和checkpoint文件外,还会同时保存两个“.data”文件:.data-00000-of-00002和.data-00001-的-00002。前者的尺寸远小于后者。我的问题是,为什么保存了两个数据文件,它们之间有什么区别?
根据tensorflow官方page:
一个或多个分片 (<prefix>-<global_step>.data-<shard_index>-of-<number_of_shards>
) 包含模型的权重,索引文件包含哪些权重存储在哪个分片中。分片的数量取决于您使用多少台机器进行训练。
因此,如果您在两台机器上训练一个模型,您将有两个后缀为 .data-00000-of-00002
和 .data-00001-of-00002
您可能也想看看 this url。
实例化tf.train.Saver
时,您可以设置参数sharded
的值(默认值为False
)。 sharded=True
指示 Saver 为每个 machine/device.