如何只保存重复项?
How to save duplicates only?
我编写了代码以从我的 xlsx 文件中的 col 中删除重复项。
import pandas as pd
from openpyxl.workbook import Workbook
def delete_duplicates(nazov_suboru, cielovy_subor,riadok):
data = pd.read_excel(nazov_suboru)
print("chvilelenku pockaj")
data.drop_duplicates(subset=[riadok], keep=False, inplace=True)
data.to_excel(cielovy_subor, index=False)
print("done")
它保存了唯一的数据。但我需要相反的东西。只保存重复的。想不通。任何想法请/
data = data[data.duplicated(subset=[riadok], keep=False)]
将保留重复的行。
我编写了代码以从我的 xlsx 文件中的 col 中删除重复项。
import pandas as pd
from openpyxl.workbook import Workbook
def delete_duplicates(nazov_suboru, cielovy_subor,riadok):
data = pd.read_excel(nazov_suboru)
print("chvilelenku pockaj")
data.drop_duplicates(subset=[riadok], keep=False, inplace=True)
data.to_excel(cielovy_subor, index=False)
print("done")
它保存了唯一的数据。但我需要相反的东西。只保存重复的。想不通。任何想法请/
data = data[data.duplicated(subset=[riadok], keep=False)]
将保留重复的行。