如何填补数据框中重复索引的空白?
How to fill in gaps of duplicate indices in dataframe?
我有一个如下所示的数据框
tdf = pd.DataFrame({'grade': np.random.choice(list('AAAD'),size=(5)),
'dash': np.random.choice(list('PPPS'),size=(5)),
'dumeel': np.random.choice(list('QWRR'),size=(5)),
'dumma': np.random.choice((1234),size=(5)),
'target': np.random.choice([0,1],size=(5))
})
我正在尝试使用一些输入列创建多索引数据框
所以,我尝试了以下
tdf.set_index(['grade','dumeel'],inplace=True)
但是,这会导致 missing/gap 重复条目(红色突出显示)
我怎样才能避免这种情况并显示我的数据框和所有索引(无论是否重复)
我希望我的输出具有基于原始数据帧的相应索引的所有行
只是显示问题:
tdf.set_index(['grade','dumeel'],inplace=True)
print (tdf)
dash dumma target
grade dumeel
A W S 855 1
R P 498 1
R P 378 0
W P 211 0
W P 12 0
with pd.option_context("display.multi_sparse", False):
print (tdf)
dash dumma target
grade dumeel
A W S 855 1
A R P 498 1
A R P 378 0
A W P 211 0
A W P 12 0
我有一个如下所示的数据框
tdf = pd.DataFrame({'grade': np.random.choice(list('AAAD'),size=(5)),
'dash': np.random.choice(list('PPPS'),size=(5)),
'dumeel': np.random.choice(list('QWRR'),size=(5)),
'dumma': np.random.choice((1234),size=(5)),
'target': np.random.choice([0,1],size=(5))
})
我正在尝试使用一些输入列创建多索引数据框
所以,我尝试了以下
tdf.set_index(['grade','dumeel'],inplace=True)
但是,这会导致 missing/gap 重复条目(红色突出显示)
我怎样才能避免这种情况并显示我的数据框和所有索引(无论是否重复)
我希望我的输出具有基于原始数据帧的相应索引的所有行
只是显示问题:
tdf.set_index(['grade','dumeel'],inplace=True)
print (tdf)
dash dumma target
grade dumeel
A W S 855 1
R P 498 1
R P 378 0
W P 211 0
W P 12 0
with pd.option_context("display.multi_sparse", False):
print (tdf)
dash dumma target
grade dumeel
A W S 855 1
A R P 498 1
A R P 378 0
A W P 211 0
A W P 12 0