Pandas drop.duplicate 功能未按预期运行
Pandas drop.duplicate function doesn't work as expected
我目前正在处理应该合并的不同数据框。我的一个数据框在我的合并变量键上有很多重复项,所以我使用 drop.duplicate
删除它们。
后来检查了我的数据框之前(它有 531 行)和之后(167 行)的形状。所以我认为它有效!
但是通过使用 value.counts[key of merge]
,它不会为我的合并变量键的每个条目 return 1
。我该如何解释并纠正它?
为了更好地理解,这是我的代码:
df_stores.drop_duplicates(subset = 'Store ID', keep = 'first' )
df_stores['Store ID'].value_counts().sort_index(ascending=True)
只是为了方便其他人访问。我在写答案有两种方式:
1.
df_stores.drop_duplicates(subset = 'Store ID', keep = 'first', inplace= True)
注意:不要到处使用它,因为它在某些情况下会引发警告
2.
df_stores = df_stores.drop_duplicates(subset = 'Store ID', keep = 'first')
我目前正在处理应该合并的不同数据框。我的一个数据框在我的合并变量键上有很多重复项,所以我使用 drop.duplicate
删除它们。
后来检查了我的数据框之前(它有 531 行)和之后(167 行)的形状。所以我认为它有效!
但是通过使用 value.counts[key of merge]
,它不会为我的合并变量键的每个条目 return 1
。我该如何解释并纠正它?
为了更好地理解,这是我的代码:
df_stores.drop_duplicates(subset = 'Store ID', keep = 'first' )
df_stores['Store ID'].value_counts().sort_index(ascending=True)
只是为了方便其他人访问。我在写答案有两种方式:
1.
df_stores.drop_duplicates(subset = 'Store ID', keep = 'first', inplace= True)
注意:不要到处使用它,因为它在某些情况下会引发警告
2.
df_stores = df_stores.drop_duplicates(subset = 'Store ID', keep = 'first')