两个数据帧的公共列中值的交集- Pandas、Python3
Intersection of values in a common column of two dataframes- Pandas, Python3
我有2个数据框; dataframe main 和 dataframe mini,具有完全相同的 headers 但其中的值不同,但是有一些重叠。我如何在单个列中获取重复值(例如列 'Name')。
示例:
主数据框
Name size length
foo 1 2
foo2 3 4
foo3 5 6
foo4 7 8
迷你数据框
Name size length
foox 60 70
foo3 3 4
fooy 50 60
foo4 7 8
伪代码:intersect(column='Name', of='dataframe mini', against='dataframe main')
提出:(foo3,foo4)
您可以使用 isin
来屏蔽另一个 df:
中的行值
In [52]:
main.loc[main['Name'].isin(mini['Name']), 'Name']
Out[52]:
2 foo3
3 foo4
Name: Name, dtype: object
我有2个数据框; dataframe main 和 dataframe mini,具有完全相同的 headers 但其中的值不同,但是有一些重叠。我如何在单个列中获取重复值(例如列 'Name')。
示例:
主数据框
Name size length
foo 1 2
foo2 3 4
foo3 5 6
foo4 7 8
迷你数据框
Name size length
foox 60 70
foo3 3 4
fooy 50 60
foo4 7 8
伪代码:intersect(column='Name', of='dataframe mini', against='dataframe main')
提出:(foo3,foo4)
您可以使用 isin
来屏蔽另一个 df:
In [52]:
main.loc[main['Name'].isin(mini['Name']), 'Name']
Out[52]:
2 foo3
3 foo4
Name: Name, dtype: object