从两个数据集创建一个集合，其中只有 df1 中的值不在 df2 中

Question

我有 2 个数据框。

我想用 df1 中的位置创建一个系列，这些位置在 df2 中不重复。

我很困惑如何做到这一点，任何答案表示赞赏

Answer 1

来自 df_1 :

>>> df_1
    values
0   a
1   b
2   c
3   d
4   e

和df_2：

>>> df_2
    values
0   b
1   e
2   f
3   g

我们可以使用 isin 方法从 df_1 中获取非重复值 df_2 ，如下所示：

>>> df_1[~df_1['values'].isin(df_2['values'])]
    values
0   a
2   c
3   d

Create a set from two datasets with only values from df1 that isnt in df2