尝试删除第一个重复值,但删除更多
Try to remove the first duplicated value but remove more instead
我正在尝试删除我的数据框中第一次出现的一些重复值,但我很确定我的代码正在删除更多值。
data=
columns>> A - Value
>> 1 - 3
2 - 3
3 - 2
4 - 2
5 - 2
6 - 4
7 - 4
...
mask = data[data.duplicated(data.columns[data.columns.isin(['A'])],keep='first')==True].index
ajustes3 = data.drop(mask)
print(mask)
Int64Index([ 0, 2, 5, 6, 7, ...4318, 4352, 4353, 4354, 4355, 4471, 4472, 4473, 4474, 4475],dtype='int64', length=1165)
抱歉,如果问题不清楚。我缺少什么?如何改进?
像这样
import pandas as pd
df = pd.DataFrame({'A':[3,3,2,2,2,4,4]})
df.loc[df.groupby('A').cumcount()>0]
输出
A
1 3
3 2
4 2
6 4
我正在尝试删除我的数据框中第一次出现的一些重复值,但我很确定我的代码正在删除更多值。
data=
columns>> A - Value
>> 1 - 3
2 - 3
3 - 2
4 - 2
5 - 2
6 - 4
7 - 4
...
mask = data[data.duplicated(data.columns[data.columns.isin(['A'])],keep='first')==True].index
ajustes3 = data.drop(mask)
print(mask)
Int64Index([ 0, 2, 5, 6, 7, ...4318, 4352, 4353, 4354, 4355, 4471, 4472, 4473, 4474, 4475],dtype='int64', length=1165)
抱歉,如果问题不清楚。我缺少什么?如何改进?
像这样
import pandas as pd
df = pd.DataFrame({'A':[3,3,2,2,2,4,4]})
df.loc[df.groupby('A').cumcount()>0]
输出
A
1 3
3 2
4 2
6 4