HDF5 文件在覆盖 pandas 数据帧后变大

HDF5 file grows in size after overwriting the pandas dataframe

我正在尝试覆盖 hdf5 文件中的 pandas 数据框。每次我这样做时,文件大小都会增加,而存储的帧内容是相同的。如果我使用 mode='w' 我会丢失所有其他记录。 这是一个错误还是我遗漏了什么?

import pandas
df = pandas.read_csv('1.csv')
for i in range(100):
  store = pandas.HDFStore('tmp.h5')
  store.put('TMP', df)
  store.close()

tmp.h5 变大了。

阅读本文底部的重要警告section

这就是 HDF5 的工作原理。