以这种方式组合 pandas 个数据帧
Combining pandas dataframes in this way
我有一个数据框 df1
:-
REGION
DATE
Count
TIME PER ID
ABC
2021-03-22
2
44
我有另一个数据框 df2
:-
ID
REGION
DATE
TIME
11
ABC
2021-03-22
198
75
ABC
2021-03-22
250
我想实现这个:-
ID
REGION
DATE
TIME
TIME PER ID
TOTAL TIME
11
ABC
2021-03-22
198
44
242
75
ABC
2021-03-22
250
44
294
基本上我想匹配 REGION
和 DATE
以及 df1
中 TIME PER ID
的任何值我想为 [=12= 中的那些行填充它] 匹配地区和日期
合并两个数据框,然后创建新列。
output_df = df2.merge(df1, on=['REGION', 'DATE'], how='left')
output_df.loc[:, 'TOTAL'] = output_df['Time'] + output_df['TIME PER ID']
我有一个数据框 df1
:-
REGION | DATE | Count | TIME PER ID |
---|---|---|---|
ABC | 2021-03-22 | 2 | 44 |
我有另一个数据框 df2
:-
ID | REGION | DATE | TIME |
---|---|---|---|
11 | ABC | 2021-03-22 | 198 |
75 | ABC | 2021-03-22 | 250 |
我想实现这个:-
ID | REGION | DATE | TIME | TIME PER ID | TOTAL TIME |
---|---|---|---|---|---|
11 | ABC | 2021-03-22 | 198 | 44 | 242 |
75 | ABC | 2021-03-22 | 250 | 44 | 294 |
基本上我想匹配 REGION
和 DATE
以及 df1
中 TIME PER ID
的任何值我想为 [=12= 中的那些行填充它] 匹配地区和日期
合并两个数据框,然后创建新列。
output_df = df2.merge(df1, on=['REGION', 'DATE'], how='left')
output_df.loc[:, 'TOTAL'] = output_df['Time'] + output_df['TIME PER ID']