使用 .isin in koalas dataframe 检查两个数据帧在列中是否具有相同的值
Check if two dataframes have the same values in the column using .isin in koalas dataframe
我在比较两个数据帧时遇到了一个小问题,数据帧的详细信息如下。
下面详述的dataframes都在koalas.
import databricks.koalas as ks
mini_team_df_1 = ks.DataFrame(['0000340b'], columns = ['team_code'])
mini_receipt_df_2 = ks.DataFrame(['0000340b'], columns = ['team_code'])
mini_receipt_df_2['match_flag'] = mini_receipt_df_2['team_code'].isin(ks.DataFrame(mini_team_df_1))
mini_receipt_df_2
我正在数据块上执行这段代码,我希望 mini_receipt_df_2
应该有如下输出:
team_code match_flag
0 0000340b True
但是在我上面显示的代码中,输出如下:
team_code match_flag
0 0000340b False
这对我来说毫无意义,因为使用 .isin 函数会给我 team_code = 0000340b
的 True
值,因为这在两个数据帧中都是相同的。
有人可以帮助我了解哪里出了问题吗?
谢谢
试试这个:
mini_receipt_df_2['match_flag'] = np.isin(mini_team_df_1['team_code'].to_numpy(), mini_receipt_df_2['team_code'])
输出:
>>> mini_receipt_df_2
team_code match_flag
0 0000340b True
我在比较两个数据帧时遇到了一个小问题,数据帧的详细信息如下。 下面详述的dataframes都在koalas.
import databricks.koalas as ks
mini_team_df_1 = ks.DataFrame(['0000340b'], columns = ['team_code'])
mini_receipt_df_2 = ks.DataFrame(['0000340b'], columns = ['team_code'])
mini_receipt_df_2['match_flag'] = mini_receipt_df_2['team_code'].isin(ks.DataFrame(mini_team_df_1))
mini_receipt_df_2
我正在数据块上执行这段代码,我希望 mini_receipt_df_2
应该有如下输出:
team_code match_flag
0 0000340b True
但是在我上面显示的代码中,输出如下:
team_code match_flag
0 0000340b False
这对我来说毫无意义,因为使用 .isin 函数会给我 team_code = 0000340b
的 True
值,因为这在两个数据帧中都是相同的。
有人可以帮助我了解哪里出了问题吗?
谢谢
试试这个:
mini_receipt_df_2['match_flag'] = np.isin(mini_team_df_1['team_code'].to_numpy(), mini_receipt_df_2['team_code'])
输出:
>>> mini_receipt_df_2
team_code match_flag
0 0000340b True