按标签删除列范围

Question

假设我有这个大数据框：

In [31]: df
Out[31]: 
    A   B   C   D   E   F   G   H   I   J ...   Q   R   S   T   U   V   W   X   Y   Z
0   0   1   2   3   4   5   6   7   8   9 ...  16  17  18  19  20  21  22  23  24  25
1  26  27  28  29  30  31  32  33  34  35 ...  42  43  44  45  46  47  48  49  50  51
2  52  53  54  55  56  57  58  59  60  61 ...  68  69  70  71  72  73  74  75  76  77

[3 rows x 26 columns]

您可以使用

创建

alphabet = [chr(letter_i) for letter_i in range(ord('A'), ord('Z')+1)]
df = pd.DataFrame(np.arange(3*26).reshape(3, 26), columns=alphabet)

使用列标签删除列 'D' 和 'R' 之间的所有列的最佳方法是什么？

我发现了一种丑陋的方法：

df.drop(df.columns[df.columns.get_loc('D'):df.columns.get_loc('R')+1], axis=1)

Answer 1

你在这里：

print df.ix[:,'A':'C'].join(df.ix[:,'S':'Z'])

Out[1]: 
    A   B   C   S   T   U   V   W   X   Y   Z
0   0   1   2  18  19  20  21  22  23  24  25
1  26  27  28  44  45  46  47  48  49  50  51
2  52  53  54  70  71  72  73  74  75  76  77

Answer 2

使用 numpy 以获得更大的灵活性...numpy 允许比较字母（可能通过比较 ASCII 位级别或其他方式）：

import numpy as np
array = (['A','B','C','D'])
array > 'B'
print(array)
print(array>'B')

给出：

['A' 'B' 'C' 'D']
array([False, False,  True,  True], dtype=bool)

更难的选择也很容易实现：

b[np.logical_and(b>'B', b<'D')]

给出：

array(['C'], 
  dtype='|S1')

Answer 3

这是我的条目：

>>> df.drop(df.columns.to_series()["D":"R"], axis=1)
    A   B   C   S   T   U   V   W   X   Y   Z
0   0   1   2  18  19  20  21  22  23  24  25
1  26  27  28  44  45  46  47  48  49  50  51
2  52  53  54  70  71  72  73  74  75  76  77

通过将 df.columns 从 Index 转换为 Series，我们可以利用 ["D":"R"] 样式选择：

>>> df.columns.to_series()["D":"R"]
D        D
E        E
F        F
G        G
H        H
I        I
J        J
...    ...
Q        Q
R        R
dtype: object

Answer 4

这是另一种方式...

low, high = df.columns.get_slice_bound(('D', 'R'), 'left')
drops = df.columns[low:high+1]
print df.drop(drops, axis=1)


    A   B   C   S   T   U   V   W   X   Y   Z
0   0   1   2  18  19  20  21  22  23  24  25
1  26  27  28  44  45  46  47  48  49  50  51
2  52  53  54  70  71  72  73  74  75  76  77

按标签删除列范围

Drop range of columns by labels

python

pandas