在 PySpark 中合并(左右)
Merging in PySpark (both left and right)
PySpark 中合并两个不同数据帧(左右)的等效代码是什么?
df_merge = pd.merge(t_df, d_df, left_on='a_id', right_on='d_id', how='inner')
join
相当于 pandas.
中的 merge
您共享的合并代码的等效 PySpark 逻辑是
t_df.join(d_df, t_df["a_id"] == d_df["d_id"], "inner")
PySpark 中合并两个不同数据帧(左右)的等效代码是什么?
df_merge = pd.merge(t_df, d_df, left_on='a_id', right_on='d_id', how='inner')
join
相当于 pandas.
merge
您共享的合并代码的等效 PySpark 逻辑是
t_df.join(d_df, t_df["a_id"] == d_df["d_id"], "inner")