如何将 SQL 样式 "is not null" 合并到 read_hdf 的 where 语句中
How to incorporate a SQL style "is not null" into the where statement of read_hdf
我正在尝试弄清楚如何从选择中排除空响应,并且想知道如何制定 where 语句以使其产生正确的选择。例如,假设我有以下代码:
df = pd.DataFrame({'A' : ['foo','foo','bar','bar','baz'],
'B' : [1,2,1,2,np.nan],
'C' : np.random.randn(5) })
df.to_hdf('test.h5', 'df', mode='w', format='table', data_columns=True)
pd.read_hdf('test.h5', 'df')
A B C
0 foo 1 -0.046065
1 foo 2 -0.987685
2 bar 1 -0.110967
3 bar 2 -1.989150
4 baz NaN 0.126864
我基本上想要等同于说:
pd.read_hdf('test.h5', 'df', where='B is not null')
我该怎么做?
谢谢!
看起来不能直接完成,这里是数字列的一个丑陋的解决方法:
pd.read_hdf('test.h5', 'df', where='B <= 0 | B > 0')
我觉得可以这样做:
pd.read_hdf('test.h5', 'df', where='B == B')
我正在尝试弄清楚如何从选择中排除空响应,并且想知道如何制定 where 语句以使其产生正确的选择。例如,假设我有以下代码:
df = pd.DataFrame({'A' : ['foo','foo','bar','bar','baz'],
'B' : [1,2,1,2,np.nan],
'C' : np.random.randn(5) })
df.to_hdf('test.h5', 'df', mode='w', format='table', data_columns=True)
pd.read_hdf('test.h5', 'df')
A B C
0 foo 1 -0.046065
1 foo 2 -0.987685
2 bar 1 -0.110967
3 bar 2 -1.989150
4 baz NaN 0.126864
我基本上想要等同于说:
pd.read_hdf('test.h5', 'df', where='B is not null')
我该怎么做?
谢谢!
看起来不能直接完成,这里是数字列的一个丑陋的解决方法:
pd.read_hdf('test.h5', 'df', where='B <= 0 | B > 0')
我觉得可以这样做:
pd.read_hdf('test.h5', 'df', where='B == B')