如何使用 h5py 阅读行式而不是列式?

How do I read Row Wise instead of column wise with h5py?

我有这个形状为 70x10,000,000(10,000,000 列 70 行)的 matlab 文件 令人恼火的是,当我 运行 这行应该打印那块数据的代码时,

f = h5py.File(filepath, 'r')
item = list(f.items())[0][1]
print(item)

它将其重塑为 10,000,000x70(10,000,000 行,70 列) 有没有办法保持原来的形状?

h5py returns HDF5 数据作为 Numpy 数组。因此,使用 h5py 的关键是在需要时使用 Numpy 方法。您可以使用 np.transpose() 轻松转置数组。下面提供了一个简单的例子。它创建一个包含 2 个数据集的 HDF5 文件:1) 形状为 (20,5) 的数组,以及 2) 形状为 (5,20) 的转置数组。然后它提取 2 个数组并使用 np.transpose() 切换 row/column 顺序。

with h5py.File('SO_67031436','w') as h5w:
    arr = np.arange(100.).reshape(20,5)
    h5w.create_dataset('ds_1',data=arr)
    h5w.create_dataset('ds_1t',data=np.transpose(arr))
    
with h5py.File('SO_67031436','r') as h5r:
    for name in h5r:
        print(name,',shape=',h5r[name].shape)
        arr=np.transpose(h5r[name][:])
        print('transposed shape=',arr.shape)