比较行中的值并识别重复项

Question

我觉得这是一个非常简单的问题。我有一个看起来像这样的数据框：

ID   Genre1         Genre2
1    Comedy         Comedy
2    Drama          Drama
3    Sport          Sport
4    Drama          Comedy
5    Documentary    Documentary
6    Entertainment  Entertainment
7    Film           Film
8    Drama          Crime Drama
9    Crime Drama    Drama

我想确定哪些行具有相同的值（例如“comedy”和“comedy”）并创建一个名为 match 的新列，将它们标记为“是”（或“否”，因为那些不匹配的）。

根据上面的示例，预期输出应如下所示：

ID   Genre1         Genre2          Match
1    Comedy         Comedy          Yes
2    Drama          Drama           Yes
3    Sport          Sport           Yes
4    Drama          Comedy          No
5    Documentary    Documentary     Yes
6    Entertainment  Entertainment   Yes
7    Film           Film            Yes
8    Drama          Crime Drama     No
9    Crime Drama    Drama           No

有什么办法可以做到这一点 and/or 哪个包最好？提前致谢！

Answer 1

使用ifelse:

df$Match <- ifelse(df$Genre1 == df$Genre2, 'Yes', 'No')

比较行中的值并识别重复项

Compare values in rows and identify duplicates

r

duplicates

match

string-matching