如何检查 pandas MultiIndex 中是否存在列
How to check if a column exists in a pandas MultiIndex
假设我有一个带有 MultiIndex 列的 DataFrame,如下所示:
In [29]: df = pd.DataFrame([[0] * 8], columns = pd.MultiIndex.from_product(
[['a', 'b'], [1, 2], [2000, 2001]])
)
In [30]: df
Out[30]:
a b
1 2 1 2
2000 2001 2000 2001 2000 2001 2000 2001
0 0 0 0 0 0 0 0 0
In [46]: df.columns.levels
Out[46]: FrozenList([[u'a', u'b'], [1, 2], [2000, 2001]])
我需要知道,对于级别 0 的所有值和级别 1 的某些特定值,级别 2 的所有现有唯一值是什么(假设 DataFrame 经历了一些过程,其中对于级别 1 的某些值和级别 0,级别 2 被丢弃)。到目前为止我能想到的最好的是:
In [54]: level_1_val = 2
In [55]: cols_series = df.columns.to_series()
In [56]: cols_series[
....: cols_series.index.get_level_values(1) == level_1_val
....: ].index.get_level_values(2).unique()
array([2000, 2001])
执行此操作的更好方法是什么?
IIUC
df.xs(2, axis=1, level=1).groupby(axis=1, level=1).first().columns.values
array([2000, 2001])
或者
df.xs(2, axis=1, level=1).columns.get_level_values(level=1).unique()
假设我有一个带有 MultiIndex 列的 DataFrame,如下所示:
In [29]: df = pd.DataFrame([[0] * 8], columns = pd.MultiIndex.from_product(
[['a', 'b'], [1, 2], [2000, 2001]])
)
In [30]: df
Out[30]:
a b
1 2 1 2
2000 2001 2000 2001 2000 2001 2000 2001
0 0 0 0 0 0 0 0 0
In [46]: df.columns.levels
Out[46]: FrozenList([[u'a', u'b'], [1, 2], [2000, 2001]])
我需要知道,对于级别 0 的所有值和级别 1 的某些特定值,级别 2 的所有现有唯一值是什么(假设 DataFrame 经历了一些过程,其中对于级别 1 的某些值和级别 0,级别 2 被丢弃)。到目前为止我能想到的最好的是:
In [54]: level_1_val = 2
In [55]: cols_series = df.columns.to_series()
In [56]: cols_series[
....: cols_series.index.get_level_values(1) == level_1_val
....: ].index.get_level_values(2).unique()
array([2000, 2001])
执行此操作的更好方法是什么?
IIUC
df.xs(2, axis=1, level=1).groupby(axis=1, level=1).first().columns.values
array([2000, 2001])
或者
df.xs(2, axis=1, level=1).columns.get_level_values(level=1).unique()