使用 .isin in koalas dataframe 检查两个数据帧在列中是否具有相同的值

Check if two dataframes have the same values in the column using .isin in koalas dataframe

我在比较两个数据帧时遇到了一个小问题,数据帧的详细信息如下。 下面详述的dataframes都在koalas.

import databricks.koalas as ks


mini_team_df_1 = ks.DataFrame(['0000340b'], columns = ['team_code'])

mini_receipt_df_2 = ks.DataFrame(['0000340b'], columns = ['team_code'])

mini_receipt_df_2['match_flag'] = mini_receipt_df_2['team_code'].isin(ks.DataFrame(mini_team_df_1))

mini_receipt_df_2

我正在数据块上执行这段代码,我希望 mini_receipt_df_2 应该有如下输出:

    team_code   match_flag

0   0000340b     True

但是在我上面显示的代码中,输出如下:

    team_code   match_flag
0   0000340b     False

这对我来说毫无意义,因为使用 .isin 函数会给我 team_code = 0000340b True 值,因为这在两个数据帧中都是相同的。

有人可以帮助我了解哪里出了问题吗?

谢谢

试试这个:

mini_receipt_df_2['match_flag'] = np.isin(mini_team_df_1['team_code'].to_numpy(), mini_receipt_df_2['team_code'])

输出:

>>> mini_receipt_df_2
  team_code  match_flag
0  0000340b        True