如何合并两个不同形状的数据集 (pandas)
How to merge two datasets with different shape (pandas)
我想合并两个不同大小的数据集。例如
df = {'identifier': [1,1,1,2,2,2],
'Income': [50,40,70,50,60,30],
}
df2= {'identifier': [1,2],
'Rent': [150,300],
}
输出如下:
df3={'identifier': [1,1,1,2,2,2],
'Income': [50,40,70,50,60,30],
'Rent': [150,150,150,300,300,300],
}
您可以使用带有默认内部联接选项的 .merge()
的内部联接。
数据设置
df = {'identifier': [1,1,1,2,2,2],
'Income': [50,40,70,50,60,30],
}
df2= {'identifier': [1,2],
'Rent': [150,300],
}
df = pd.DataFrame(df)
df2 = pd.DataFrame(df2)
主要代码:
df3 = df.merge(df2, on='identifier')
结果:
print(df3)
identifier Income Rent
0 1 50 150
1 1 40 150
2 1 70 150
3 2 50 300
4 2 60 300
5 2 30 300
df.merge(df2, on='identifier')
我想合并两个不同大小的数据集。例如
df = {'identifier': [1,1,1,2,2,2],
'Income': [50,40,70,50,60,30],
}
df2= {'identifier': [1,2],
'Rent': [150,300],
}
输出如下:
df3={'identifier': [1,1,1,2,2,2],
'Income': [50,40,70,50,60,30],
'Rent': [150,150,150,300,300,300],
}
您可以使用带有默认内部联接选项的 .merge()
的内部联接。
数据设置
df = {'identifier': [1,1,1,2,2,2],
'Income': [50,40,70,50,60,30],
}
df2= {'identifier': [1,2],
'Rent': [150,300],
}
df = pd.DataFrame(df)
df2 = pd.DataFrame(df2)
主要代码:
df3 = df.merge(df2, on='identifier')
结果:
print(df3)
identifier Income Rent
0 1 50 150
1 1 40 150
2 1 70 150
3 2 50 300
4 2 60 300
5 2 30 300
df.merge(df2, on='identifier')