Pandas Hdf 获取 table 信息

Pandas Hdf Get table info

有什么方法可以使用 pandas HDF 存储获取 HDF table 的信息?

例如在SQL中有:

SELECT COUNT(*)

我想阅读基本的 table 尺寸而不必加载 table 本身。

试试这个:

In [4]: %paste
store_path = r'c:/temp/.data/test.h5'
store_key = 'test'

df.to_hdf(store_path, key=store_key, mode='w', format='t', complib='zlib', complevel=4)
## -- End pasted text --

In [5]: store =  pd.HDFStore(store_path)

可用方法

In [6]: store.
store.append                store.flush                 store.items                 store.root
store.append_to_multiple    store.get                   store.iteritems             store.select
store.close                 store.get_node              store.keys                  store.select_as_coordinates
store.copy                  store.get_storer            store.open                  store.select_as_multiple
store.create_table_index    store.groups                store.put                   store.select_column
store.filename              store.is_open               store.remove

显示项目

In [6]: store.items
Out[6]:
<bound method HDFStore.items of <class 'pandas.io.pytables.HDFStore'>
File path: c:/temp/.data/test.h5
/test            frame_table  (typ->appendable,nrows->1000000,ncols->3,indexers->[index])>

In [8]: store.append('test_indexed', df, data_columns=df.columns)

In [9]: store.items
Out[9]:
<bound method HDFStore.items of <class 'pandas.io.pytables.HDFStore'>
File path: c:/temp/.data/test.h5
/test                    frame_table  (typ->appendable,nrows->1000000,ncols->3,indexers->[index])
/test_indexed            frame_table  (typ->appendable,nrows->1000000,ncols->3,indexers->[index],dc->[A,B,C])>

Docs