如何访问 hdf5 格式的数据集中的图像?

How to access images in a dataset in hdf5 format?

我从以下网站 http://microbia.org/index.php/resources 访问了一个高光谱数据集。它被称为“dataset.hdf5”。我正在尝试探索里面的数据

import numpy as np
import h5py

hf=h5py.File("dataset.hdf5", 'r')
hf.keys()

Output:

<KeysViewHDF5 ['CSSs', 'IMGs', 'SEGMs', 'agarFootprint', 'circularity', 'convexity', 'hemolysis', 'inertia', 'labels', 'labelsPathogens', 'positions', 'sizes', 'waves']>

dataset_IMGs= hf['IMGs']
dataset_IMGs[:]

Output:

array([b'IMG_WLATRIO_51145900_T1080_TW0H1S1',
       b'IMG_WLATRIO_51145900_T1080_TW0H1S1',
       b'IMG_WLATRIO_51145900_T1080_TW0H1S1', ...,
       b'IMG_WLATRIO_51144600_T1080_TW0H1S1',
       b'IMG_WLATRIO_51144600_T1080_TW0H1S1',
       b'IMG_WLATRIO_51144600_T1080_TW0H1S1'], dtype='|S35') 

我的目标是以原始格式实际提取这些图像,但我在上面看到的是某种二进制编码。我搜索并尝试了找到的脚本,但 none 帮助我提取了这些图像。

有没有人知道提取这些图像的内容和方法?

我同意@jacub。该文件中似乎没有任何图像数据。我使用了一个实用程序来获取数据集及其内容的摘要。 IMGs 是一个文件名数组 这是我发现的:

C:\Users\walker\Downloads>ptdump dataset.hdf5
/ (RootGroup) ''
/CSSs (Array(10398, 125)) ''
/IMGs (Array(10398,)) ''
/SEGMs (Array(10398,)) ''
/agarFootprint (Array(10398, 125)) ''
/circularity (Array(10398,)) ''
/convexity (Array(10398,)) ''
/hemolysis (Array(10398,)) ''
/inertia (Array(10398,)) ''
/labels (Array(10398,)) ''
/labelsPathogens (Array(10398,)) ''
/positions (Array(10398, 2)) ''
/sizes (Array(10398,)) ''
/waves (Array(125,)) ''

link 对该文件有以下评论:“高光谱数据库包含来自固体血琼脂平板上细菌菌落的选定 collection 光谱特征。...该数据库旨在提供第一个基准来评估此应用程序的图像分析算法性能。"

您可以使用此标题下的 link 获取原始图像数据:MicrobIA 图像数据集(测试版 0.1) MicrobIA_Dataset...sample.zip 有 20 张图像在4个文件夹中。我会从那里开始。其他数据集似乎需要我没有的帐户/登录名。