HDF5 是存储 JSON 数据的合适技术吗?

Is HDF5 an Appropriate Technology to Store JSON Data?

我继承了一些调用网络的代码 API,并得到了一个深度嵌套(最多八层)的响应。

我已经编写了一些代码来展平结构,以便可以将其写入 .csv 文件和 SQL 数据库,以便人们更轻松地使用。

不过,我真正想做的是保留原始响应的一个版本,以便在我 want/need 时可以参考原始结构。

我了解 HDF5 主要用于存储数字数据。有什么理由不使用它来转储 JSON blob 吗?这似乎比设置 NoSQL 数据库容易得多。

应该没问题。听起来您会将每个 JSON 响应存储为 HDF5 可变长度字符串。很好,它只是一个字符串到库。

您打算将每个响应存储为单独的数据集吗?如果您谈论的是 >1000 的响应,那可能效率低下。

或者,您可以创建一维可扩展数据集,并在每个响应中附加到它。

决定更容易设置 Mongo 数据库。