如何只过滤重复的评论
How to filter only duplicate comments
您好 :) 有两列:情绪和评论。如何只过滤数据集中重复的评论?谢谢四位的帮助:)
你可以使用pandas.DataFrame.duplicated
df[df.comment.duplicated(False)]
这取决于您希望仅输出重复记录的列。
示例 1 - 基于名为 df
的数据框中的所有列
duplicates = df[df.duplicated(keep=False)] #False means retaining all duplicates
示例2 - 基于某列或多列
duplicate = dictionary_df[dictionary_df[0].duplicated(keep=False)]#This is on the first column
您好 :) 有两列:情绪和评论。如何只过滤数据集中重复的评论?谢谢四位的帮助:)
你可以使用pandas.DataFrame.duplicated
df[df.comment.duplicated(False)]
这取决于您希望仅输出重复记录的列。
示例 1 - 基于名为 df
的数据框中的所有列duplicates = df[df.duplicated(keep=False)] #False means retaining all duplicates
示例2 - 基于某列或多列
duplicate = dictionary_df[dictionary_df[0].duplicated(keep=False)]#This is on the first column