如何只过滤重复的评论

How to filter only duplicate comments

您好 :) 有两列:情绪和评论。如何只过滤数据集中重复的评论?谢谢四位的帮助:)

你可以使用pandas.DataFrame.duplicated

df[df.comment.duplicated(False)]

这取决于您希望仅输出重复记录的列。

示例 1 - 基于名为 df

的数据框中的所有列
duplicates = df[df.duplicated(keep=False)] #False means retaining all duplicates

示例2 - 基于某列或多列

duplicate = dictionary_df[dictionary_df[0].duplicated(keep=False)]#This is on the first column