使用 numpy 布尔值对特定列的 pandas 行进行切片

Slice pandas row of a specific column using numpy boolean

objective 是使用 Numpy 布尔值对特定列的多个 pandas 行进行切片。

下面的代码应该完成任务

import numpy as np
import numpy.random
import pandas as pd
numpy.random.seed(0)

h=((), ('x'), (), ('y'), (), (), ())

drop_idx=[n for n, dl in enumerate(h) if len(dl)]

df = pd.DataFrame(np.arange(7),columns=['class'])

df.reset_index(inplace=True)
df2=pd.DataFrame(np.arange(5),columns=[('feature','ch1')])

idx_true=np.invert(np.array(h).astype(bool))
g=df[idx_true.tolist()].reset_index(drop=True)
df2['dlabel']=g['class']

但是,我想知道上面的代码是否可以进一步缩短,尤其是这些行

idx_true=np.invert(np.array(h).astype(bool))
g=df[idx_true.tolist()].reset_index(drop=True)
df2['dlabel']=g['class']

目前,如果我要直接使用 Numpy 布尔值而不转换为列表

Pandas 会抛出错误
df[idx_true.tolist()]

有什么我想念的吗,或者这是实现预期目标的唯一方法objective?

您可以简单地使用:

df2['dlabel'] = df.loc[idx_true, 'class'].values

实际上,您甚至不需要将 h 转换为 numpy 数组:

df2['dlabel'] = df.loc[[not bool(x) for x in h], 'class'].values

输出:

   (feature, ch1)  dlabel
0  0               0     
1  1               2     
2  2               4     
3  3               5     
4  4               6