HDF5 文件在覆盖 pandas 数据帧后变大
HDF5 file grows in size after overwriting the pandas dataframe
我正在尝试覆盖 hdf5 文件中的 pandas 数据框。每次我这样做时,文件大小都会增加,而存储的帧内容是相同的。如果我使用 mode='w' 我会丢失所有其他记录。
这是一个错误还是我遗漏了什么?
import pandas
df = pandas.read_csv('1.csv')
for i in range(100):
store = pandas.HDFStore('tmp.h5')
store.put('TMP', df)
store.close()
tmp.h5 变大了。
阅读本文底部的重要警告section
这就是 HDF5 的工作原理。
我正在尝试覆盖 hdf5 文件中的 pandas 数据框。每次我这样做时,文件大小都会增加,而存储的帧内容是相同的。如果我使用 mode='w' 我会丢失所有其他记录。 这是一个错误还是我遗漏了什么?
import pandas
df = pandas.read_csv('1.csv')
for i in range(100):
store = pandas.HDFStore('tmp.h5')
store.put('TMP', df)
store.close()
tmp.h5 变大了。
阅读本文底部的重要警告section
这就是 HDF5 的工作原理。