zarr 生成多少个文件?

How many files does zarr generate?

我正在寻找 hdf5 的线程安全替代方案以在多处理环境中读取并偶然发现 zarr,根据基准,据说它基本上是 h5py 在python 环境。

我试过了,到目前为止一切看起来都不错,但我无法理解 zarr 输出的文件数量。

如果我用 h5py 写入一个 h5 文件,只有一个文件结果,而 zarr 似乎在子文件夹中输出随机数量的文件。

有人可以向我解释为什么会这样吗?创建文件的确切数量取决于什么?

提前致谢

Zarr 通常将键(特定块索引)映射到表示该块数据的值(二进制 blob)。如果您使用 DirectoryStore,这会导致许多不同的文件被写入磁盘。看到的文件数量将取决于您的数组有多少块以及哪些包含重要内容(如非零值)。