从两个数据集创建一个集合,其中只有 df1 中的值不在 df2 中
Create a set from two datasets with only values from df1 that isnt in df2
我有 2 个数据框。
我想用 df1 中的位置创建一个系列,这些位置在 df2 中不重复。
我很困惑如何做到这一点,任何答案表示赞赏
来自 df_1
:
>>> df_1
values
0 a
1 b
2 c
3 d
4 e
和df_2
:
>>> df_2
values
0 b
1 e
2 f
3 g
我们可以使用 isin
方法从 df_1
中获取非重复值 df_2
,如下所示:
>>> df_1[~df_1['values'].isin(df_2['values'])]
values
0 a
2 c
3 d
我有 2 个数据框。
我想用 df1 中的位置创建一个系列,这些位置在 df2 中不重复。
我很困惑如何做到这一点,任何答案表示赞赏
来自 df_1
:
>>> df_1
values
0 a
1 b
2 c
3 d
4 e
和df_2
:
>>> df_2
values
0 b
1 e
2 f
3 g
我们可以使用 isin
方法从 df_1
中获取非重复值 df_2
,如下所示:
>>> df_1[~df_1['values'].isin(df_2['values'])]
values
0 a
2 c
3 d