如何删除 pandas 中的镜像重复对行?
How to remove mirror duplicate pair rows in pandas?
这是我的数据框,由 a、b、c、d 列组成。
这里
1 2 3 4
有
的镜像重复对行
3 4 1 2
删除重复对应该给我
df.loc[pd.DataFrame(np.sort(df[['a','b','c','d']],1),index=df.index).drop_duplicates(keep='first').index]
您可以使用 np.sort 按升序对列进行排序,然后使用 .drop duplicates 删除重复的行。
这是我的数据框,由 a、b、c、d 列组成。
这里
1 2 3 4
有
的镜像重复对行3 4 1 2
删除重复对应该给我
df.loc[pd.DataFrame(np.sort(df[['a','b','c','d']],1),index=df.index).drop_duplicates(keep='first').index]
您可以使用 np.sort 按升序对列进行排序,然后使用 .drop duplicates 删除重复的行。