将字符串添加到 h5 文件

Add string to h5 file

我有以下代码:

import tables
import numpy as np

filename = "file.h5"

x = np.random.random(150)
z = np.random.random(150)
mystr = " " * 160

f = tables.open_file(filename, mode="w")
hds = f.create_carray(f.root, "x", obj=x, 
                      filters=tables.Filters(complevel=5, complib='zlib'))
hds = f.create_carray(f.root, "z", obj=z, 
                      filters=tables.Filters(complevel=5, complib='zlib'))                
f.close()

我想在我的文件中添加一个长度为 160 的字符串。有没有一种优雅的方法可以做到这一点?

提前谢谢你。

使用 h5py,您可以将包含字符串(或仅一个)的 numpy 数组存储为数据集。或者您可以将字符串存储为组或数据集的属性。

 http://docs.h5py.org/en/latest/strings.html

它可以像这样简单:

dset.attrs["title"] = "Hello"

我没有使用过tables,但它也必须能够访问这些属性。文档里没有什么吗?

文件对象本身也有一个 .attrs 字典。

在H5中存储字符串类型的数据有些棘手。 Python 首次H5用户的常见问题。在放入 H5 数据集之前必须清楚地呈现数据类型(即,无论是字符串、整数还是浮点数)。至于字符串数据类型,您需要将其指定为变量。例如,dt = h5py.string_dtype().

下面是一个将字符串放入H5文件的例子。

import h5py
data = 'value in string'
f= h5py.File('./fname.h5','w')
try:
    dt = h5py.string_dtype()
    f.create_dataset('str_data', data=data, dtype=dt)
except Exception as ex:
    print(ex)
finally:
    f.close()

另外,供您参考,检查数据是否正确存储,只需使用以下代码。

f= h5py.File('./fname.h5','r')
try:
    print(f.keys())
    print(f['str_data'][()])
except Exception as ex:
    print(ex)
finally:
    f.close()

如需进一步参考,请阅读有关 HDF5 中字符串的 H5 文档。 http://docs.h5py.org/en/stable/strings.html