用 Pandas 连接数据帧交替行
Concatenate dataframes alternating rows with Pandas
我有两个数据帧 df1
和 df2
定义如下:
df1 df2
Out[69]: Out[70]:
A B A B
0 2 a 0 5 q
1 1 s 1 6 w
2 3 d 2 3 e
3 4 f 3 1 r
我的目标是通过交替行来连接数据帧,以便生成的数据帧如下所示:
dff
Out[71]:
A B
0 2 a <--- belongs to df1
0 5 q <--- belongs to df2
1 1 s <--- belongs to df1
1 6 w <--- belongs to df2
2 3 d <--- belongs to df1
2 3 e <--- belongs to df2
3 4 f <--- belongs to df1
3 1 r <--- belongs to df2
可以看到dff的第一行对应df1的第一行,dff的第二行对应df2的第一行。模式重复直到结束。
我尝试使用以下代码行来实现我的目标:
import pandas as pd
df1 = pd.DataFrame({'A':[2,1,3,4], 'B':['a','s','d','f']})
df2 = pd.DataFrame({'A':[5,6,3,1], 'B':['q','w','e','r']})
dfff = pd.DataFrame()
for i in range(0,4):
dfx = pd.concat([df1.iloc[i].T, df2.iloc[i].T])
dfff = pd.concat([dfff, dfx])
但是这种方法不起作用,因为 df1.iloc[i]
和 df2.iloc[i] 会自动重塑为列而不是行,我无法恢复该过程(即使使用 .T
).
问题:能否请您建议我一个漂亮而优雅的方式来实现我的目标?
可选: 你能解释一下如何将列转换回行吗?
IIUC
In [64]: pd.concat([df1, df2]).sort_index()
Out[64]:
A B
0 2 a
0 5 q
1 1 s
1 6 w
2 3 d
2 3 e
3 4 f
3 1 r
我无法对已接受的答案发表评论,但请注意默认情况下排序操作不稳定,因此您必须选择稳定的排序算法。
pd.concat([df1, df2]).sort_index(kind='merge')
我有两个数据帧 df1
和 df2
定义如下:
df1 df2
Out[69]: Out[70]:
A B A B
0 2 a 0 5 q
1 1 s 1 6 w
2 3 d 2 3 e
3 4 f 3 1 r
我的目标是通过交替行来连接数据帧,以便生成的数据帧如下所示:
dff
Out[71]:
A B
0 2 a <--- belongs to df1
0 5 q <--- belongs to df2
1 1 s <--- belongs to df1
1 6 w <--- belongs to df2
2 3 d <--- belongs to df1
2 3 e <--- belongs to df2
3 4 f <--- belongs to df1
3 1 r <--- belongs to df2
可以看到dff的第一行对应df1的第一行,dff的第二行对应df2的第一行。模式重复直到结束。
我尝试使用以下代码行来实现我的目标:
import pandas as pd
df1 = pd.DataFrame({'A':[2,1,3,4], 'B':['a','s','d','f']})
df2 = pd.DataFrame({'A':[5,6,3,1], 'B':['q','w','e','r']})
dfff = pd.DataFrame()
for i in range(0,4):
dfx = pd.concat([df1.iloc[i].T, df2.iloc[i].T])
dfff = pd.concat([dfff, dfx])
但是这种方法不起作用,因为 df1.iloc[i]
和 df2.iloc[i] 会自动重塑为列而不是行,我无法恢复该过程(即使使用 .T
).
问题:能否请您建议我一个漂亮而优雅的方式来实现我的目标?
可选: 你能解释一下如何将列转换回行吗?
IIUC
In [64]: pd.concat([df1, df2]).sort_index()
Out[64]:
A B
0 2 a
0 5 q
1 1 s
1 6 w
2 3 d
2 3 e
3 4 f
3 1 r
我无法对已接受的答案发表评论,但请注意默认情况下排序操作不稳定,因此您必须选择稳定的排序算法。
pd.concat([df1, df2]).sort_index(kind='merge')