比较行中的值并识别重复项
Compare values in rows and identify duplicates
我觉得这是一个非常简单的问题。我有一个看起来像这样的数据框:
ID Genre1 Genre2
1 Comedy Comedy
2 Drama Drama
3 Sport Sport
4 Drama Comedy
5 Documentary Documentary
6 Entertainment Entertainment
7 Film Film
8 Drama Crime Drama
9 Crime Drama Drama
我想确定哪些行具有相同的值(例如“comedy”和“comedy”)并创建一个名为 match
的新列,将它们标记为“是”(或“否”,因为那些不匹配的)。
根据上面的示例,预期输出应如下所示:
ID Genre1 Genre2 Match
1 Comedy Comedy Yes
2 Drama Drama Yes
3 Sport Sport Yes
4 Drama Comedy No
5 Documentary Documentary Yes
6 Entertainment Entertainment Yes
7 Film Film Yes
8 Drama Crime Drama No
9 Crime Drama Drama No
有什么办法可以做到这一点 and/or 哪个包最好?提前致谢!
使用ifelse
:
df$Match <- ifelse(df$Genre1 == df$Genre2, 'Yes', 'No')
我觉得这是一个非常简单的问题。我有一个看起来像这样的数据框:
ID Genre1 Genre2
1 Comedy Comedy
2 Drama Drama
3 Sport Sport
4 Drama Comedy
5 Documentary Documentary
6 Entertainment Entertainment
7 Film Film
8 Drama Crime Drama
9 Crime Drama Drama
我想确定哪些行具有相同的值(例如“comedy”和“comedy”)并创建一个名为 match
的新列,将它们标记为“是”(或“否”,因为那些不匹配的)。
根据上面的示例,预期输出应如下所示:
ID Genre1 Genre2 Match
1 Comedy Comedy Yes
2 Drama Drama Yes
3 Sport Sport Yes
4 Drama Comedy No
5 Documentary Documentary Yes
6 Entertainment Entertainment Yes
7 Film Film Yes
8 Drama Crime Drama No
9 Crime Drama Drama No
有什么办法可以做到这一点 and/or 哪个包最好?提前致谢!
使用ifelse
:
df$Match <- ifelse(df$Genre1 == df$Genre2, 'Yes', 'No')