使用 Group.visititems 时有没有办法获取数据集或组的父级?

Is there a way to get the parent of a dataset or group while using Group.visititems?

我正在尝试将 h5py File 对象放入树结构中,以便我可以使用它打印出树的表示形式的能力,以与 linux 相同的方式显示文件的内容"tree" 命令递归显示目录的内容。递归访问文件中所有项目的最佳方法是使用 Group.visititems 方法并传入我将用于向树添加节点的函数。这是我目前所拥有的:

import h5py
import argparse
import sys
from anytree import Node, RenderTree

class HDFTree:
    def __init__(self,filename):
        self._file = h5py.File(filename,'r')
        self._root = Node(filename)
        self._node_map = {filename:self._root}
        self._create_tree()

    def _add_node(self,name,item):
        #TODO: Figure out way to get parent of fnode
        parent_node = self._node_map[item.parent] # I don't think item.parent is a thing so this wont work
        self._node_map[name] = Node(name,parent=parent_node)

    def _create_tree(self):
        self._file.visititems(self._add_node)

    def print_tree(self):
        print(RenderTree(self._root))

    def __del__(self):
        self._file.close()

在意识到 Dataset 和 Group class 都确实有一个父属性(hpaulj 在对该问题的评论中也指出)和一些数据清理后,我能够得到我想要的输出:

import h5py
import os
from anytree import Node, RenderTree

class HDFTree:
    def __init__(self,filepath):
        self._file = h5py.File(filepath,'r')
        _,filename = os.path.split(filepath)
        root_name,_ = os.path.splitext(filename)
        self._root = Node(root_name)
        self._node_map = {'':self._root}
        self._create_tree()

    def _add_node(self,name,item):
        _,parent_name = os.path.split(item.parent.name)
        parent_node = self._node_map[parent_name]
        _,child_name = os.path.split(name)
        self._node_map[child_name] = Node(child_name,parent=parent_node)

    def _create_tree(self):
        self._file.visititems(self._add_node)

    def print_tree(self):
        print(RenderTree(self._root))

    def __del__(self):
        self._file.close()

Dataset 和 Group classes 的名称属性显然给出了完整的 hdf5 路径,所以我用一些 os.path 函数清理了它。