在 pandas 的多索引数据框中删除重复项
Drop duplicate in multiindex dataframe in pandas
我正在寻找一种有效的方法来删除具有 Pandas 的多索引数据框中的重复列。
我的数据:
TypePoint TIME Test ... T1 T1
- S Unit1 ... unit unit
(POINT, -) ...
24001 90.00 100.000 ... 303.15 303.15
24002 390.00 101.000 ... 303.15 303.15
... ... ... ... ...
24801 10000 102.000 ... 303.15 303.15
24802 10500 103.000 ... 303.15 303.15
header包含两个信息。变量的名称及其单位。
我想删除变量 "T1" (重复变量)。
.drop_duplicates() 不起作用。我收到 "Buffer has wrong number of dimensions (expected 1, got 2)" 错误。
.drop(Data('T1','unit'),axis=1) 也不起作用。删除两列,而不仅仅是其中一列。
感谢您的帮助
我认为你可以使用双 T
:
print df
TypePoint TIME Test T1
- S Unit1 unit unit
0 24001 90 100 303.15 303.15
1 24002 390 101 303.15 303.15
2 24801 10000 102 303.15 303.15
3 24802 10500 103 303.15 303.15
print df.T.drop_duplicates().T
TypePoint TIME Test T1
- S Unit1 unit
0 24001 90 100 303.15
1 24002 390 101 303.15
2 24801 10000 102 303.15
3 24802 10500 103 303.15
我正在寻找一种有效的方法来删除具有 Pandas 的多索引数据框中的重复列。
我的数据:
TypePoint TIME Test ... T1 T1
- S Unit1 ... unit unit
(POINT, -) ...
24001 90.00 100.000 ... 303.15 303.15
24002 390.00 101.000 ... 303.15 303.15
... ... ... ... ...
24801 10000 102.000 ... 303.15 303.15
24802 10500 103.000 ... 303.15 303.15
header包含两个信息。变量的名称及其单位。 我想删除变量 "T1" (重复变量)。
.drop_duplicates() 不起作用。我收到 "Buffer has wrong number of dimensions (expected 1, got 2)" 错误。
.drop(Data('T1','unit'),axis=1) 也不起作用。删除两列,而不仅仅是其中一列。
感谢您的帮助
我认为你可以使用双 T
:
print df
TypePoint TIME Test T1
- S Unit1 unit unit
0 24001 90 100 303.15 303.15
1 24002 390 101 303.15 303.15
2 24801 10000 102 303.15 303.15
3 24802 10500 103 303.15 303.15
print df.T.drop_duplicates().T
TypePoint TIME Test T1
- S Unit1 unit
0 24001 90 100 303.15
1 24002 390 101 303.15
2 24801 10000 102 303.15
3 24802 10500 103 303.15