多个 HDF5 文件的 HDF5 数据层定义
HDF5 data layer definition for multiple HDF5 files
我知道 Caffe 不会让你拥有大于 2GB 的 HDF5 数据层。
我有一个大数据集,我将我的大数据集分成 5 个小于 2GB 的块。
我在 'train.txt'
文件中列出了五个文件。
如何在我的网络 prototxt 文件的 "HDF5Data"
层中定义它?
仅将它们全部列为顶部会产生错误。
有什么小例子吗?
谢谢!
干杯
您应该有 文本 文件 'train.txt'
包含以下内容
/path/to/first.h5
/path/to/second.h5
/path/to/third.h5
/path/to/fourth.h5
/path/to/fifth.h5
然后,作为 "HDF5Data"
层的 source
你应该给 only 'train.txt'
:
layer {
type: "HDF5Data"
name: "data"
# put your "top" here, if you have several - then go ahead
hdf5_data_param {
source: "/path/to/train.txt" # only the list file goes here.
}
include { phase: TRAIN }
}
如您所见,'/path/to/first.h5'
没有在 train.prototxt
中明确列出,仅在 train.txt
.
中列出
我知道 Caffe 不会让你拥有大于 2GB 的 HDF5 数据层。
我有一个大数据集,我将我的大数据集分成 5 个小于 2GB 的块。
我在 'train.txt'
文件中列出了五个文件。
如何在我的网络 prototxt 文件的 "HDF5Data"
层中定义它?
仅将它们全部列为顶部会产生错误。
有什么小例子吗?
谢谢!
干杯
您应该有 文本 文件 'train.txt'
包含以下内容
/path/to/first.h5 /path/to/second.h5 /path/to/third.h5 /path/to/fourth.h5 /path/to/fifth.h5
然后,作为 "HDF5Data"
层的 source
你应该给 only 'train.txt'
:
layer {
type: "HDF5Data"
name: "data"
# put your "top" here, if you have several - then go ahead
hdf5_data_param {
source: "/path/to/train.txt" # only the list file goes here.
}
include { phase: TRAIN }
}
如您所见,'/path/to/first.h5'
没有在 train.prototxt
中明确列出,仅在 train.txt
.