使用 python 根据不同的数据列选择数据行
selecting row of data based on different column of data using python
我正在尝试从具有不同列的 .csv 文件中过滤数据,如下所示-:
显示的预期结果是根据注释列显示的列表中应包含“人类”或“智人”。
如果符合条件 Series.isin
则获取分组,然后再次过滤原始 DataFrame:
df =df[df['extId'].isin(df.loc[df['Annotation'].isin(['human','homosapians']), 'extId'])]
或测试是否至少有一个值匹配 GroupBy.transform
with GroupBy.any
:
df =df[df['Annotation'].isin(['human','homosapians']).groupby(df['extId']).transform('any')]
df[(df['Annotation'] == 'human') | (df['Annotation'] == 'homosapians')]
我正在尝试从具有不同列的 .csv 文件中过滤数据,如下所示-:
显示的预期结果是根据注释列显示的列表中应包含“人类”或“智人”。
如果符合条件 Series.isin
则获取分组,然后再次过滤原始 DataFrame:
df =df[df['extId'].isin(df.loc[df['Annotation'].isin(['human','homosapians']), 'extId'])]
或测试是否至少有一个值匹配 GroupBy.transform
with GroupBy.any
:
df =df[df['Annotation'].isin(['human','homosapians']).groupby(df['extId']).transform('any')]
df[(df['Annotation'] == 'human') | (df['Annotation'] == 'homosapians')]