Pandas 具有分层列的数据框的数据框

Question

我在 pandas:

中创建了一个分层数据框

import pandas as pd
import numpy as np
col_index = pd.MultiIndex.from_product([[0,1], ['a', 'b', 'c']])
df_outer = pd.DataFrame(index=range(4), columns=col_index)
print(df_outer)

     0              1          
     a    b    c    a    b    c
 0  NaN  NaN  NaN  NaN  NaN  NaN
 1  NaN  NaN  NaN  NaN  NaN  NaN
 2  NaN  NaN  NaN  NaN  NaN  NaN
 3  NaN  NaN  NaN  NaN  NaN  NaN

我想知道是否可以用另一个数据框填充此数据框中的每个条目，例如：

inner_names = ['w', 'x', 'y', 'z']
df_inner = pd.DataFrame(np.random.randn(4,4), index=inner_names, columns=inner_names)

如果这是个坏主意，创建一些其他易于索引的数据结构的更好方法是什么？该数据结构包含我想放入 df_outer 的元素中的数据框？

Answer 1

有点疯狂，因为需要在列中有 3 个级别，在索引中需要 2 个级别，然后通过选择 slicers:

来分配

np.random.seed(452)

col_index = pd.MultiIndex.from_product([[0,1], ['a', 'b', 'c'], ['w', 'x']])
idx = pd.MultiIndex.from_product([range(2), ['w', 'x']])
df_outer = pd.DataFrame(columns=col_index, index=idx)
print(df_outer)
       0                             1                         
       a         b         c         a         b         c     
       w    x    w    x    w    x    w    x    w    x    w    x
0 w  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
  x  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
1 w  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
  x  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN

inner_names = ['w', 'x']
df_inner = pd.DataFrame(np.random.randn(2,2), index=inner_names, columns=inner_names)
print(df_inner)
          w         x
w -0.182421  0.962712
x -0.118524 -0.784380

idx = pd.IndexSlice
df_outer.loc[idx[0,:], idx[0, 'a', :]]= df_inner.values
print(df_outer)
            0                                  1                         
            a              b         c         a         b         c     
            w         x    w    x    w    x    w    x    w    x    w    x
0 w -0.182421  0.962712  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
  x -0.118524  -0.78438  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
1 w       NaN       NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
  x       NaN       NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN

Pandas 具有分层列的数据框的数据框

Pandas dataframe of dataframes with hierarchical columns

python

multidimensional-array

hierarchical-data

dataframe

pandas