如何使用 h5py 阅读行式而不是列式?
How do I read Row Wise instead of column wise with h5py?
我有这个形状为 70x10,000,000(10,000,000 列 70 行)的 matlab 文件
令人恼火的是,当我 运行 这行应该打印那块数据的代码时,
f = h5py.File(filepath, 'r')
item = list(f.items())[0][1]
print(item)
它将其重塑为 10,000,000x70(10,000,000 行,70 列)
有没有办法保持原来的形状?
h5py returns HDF5 数据作为 Numpy 数组。因此,使用 h5py 的关键是在需要时使用 Numpy 方法。您可以使用 np.transpose()
轻松转置数组。下面提供了一个简单的例子。它创建一个包含 2 个数据集的 HDF5 文件:1) 形状为 (20,5) 的数组,以及 2) 形状为 (5,20) 的转置数组。然后它提取 2 个数组并使用 np.transpose()
切换 row/column 顺序。
with h5py.File('SO_67031436','w') as h5w:
arr = np.arange(100.).reshape(20,5)
h5w.create_dataset('ds_1',data=arr)
h5w.create_dataset('ds_1t',data=np.transpose(arr))
with h5py.File('SO_67031436','r') as h5r:
for name in h5r:
print(name,',shape=',h5r[name].shape)
arr=np.transpose(h5r[name][:])
print('transposed shape=',arr.shape)
我有这个形状为 70x10,000,000(10,000,000 列 70 行)的 matlab 文件 令人恼火的是,当我 运行 这行应该打印那块数据的代码时,
f = h5py.File(filepath, 'r')
item = list(f.items())[0][1]
print(item)
它将其重塑为 10,000,000x70(10,000,000 行,70 列) 有没有办法保持原来的形状?
h5py returns HDF5 数据作为 Numpy 数组。因此,使用 h5py 的关键是在需要时使用 Numpy 方法。您可以使用 np.transpose()
轻松转置数组。下面提供了一个简单的例子。它创建一个包含 2 个数据集的 HDF5 文件:1) 形状为 (20,5) 的数组,以及 2) 形状为 (5,20) 的转置数组。然后它提取 2 个数组并使用 np.transpose()
切换 row/column 顺序。
with h5py.File('SO_67031436','w') as h5w:
arr = np.arange(100.).reshape(20,5)
h5w.create_dataset('ds_1',data=arr)
h5w.create_dataset('ds_1t',data=np.transpose(arr))
with h5py.File('SO_67031436','r') as h5r:
for name in h5r:
print(name,',shape=',h5r[name].shape)
arr=np.transpose(h5r[name][:])
print('transposed shape=',arr.shape)