在 PySpark 中合并(左右)

Merging in PySpark (both left and right)

PySpark 中合并两个不同数据帧(左右)的等效代码是什么?

df_merge = pd.merge(t_df, d_df, left_on='a_id', right_on='d_id', how='inner')

join 相当于 pandas.

中的 merge

您共享的合并代码的等效 PySpark 逻辑是


t_df.join(d_df, t_df["a_id"] == d_df["d_id"], "inner")