将数组列表作为列附加到具有相同列索引的 pandas 数据框
Append a list of arrays as column to pandas Data Frame with same column indices
我有一个数组列表(一维 numpy 数组)(a_) 和一个列表 (l_),并且想要一个以它们作为列的 DataFrame。它们看起来像这样:
a_: [array([381]), array([376]), array([402]), array([400])...]
l_: [1.5,2.34,4.22,...]
我可以通过:
df_l = pd.DataFrame(l_)
df_a = pd.DataFrame(a_)
df = pd.concat([df_l, df_a], axis=1)
有没有更短的方法?我尝试使用 pd.append
:
df_l = pd.DataFrame(l_)
df_l = df_l.append(a_)
但是,由于列索引均为 0,因此它会将 a_ 添加到数据框列的末尾,从而产生单列。有没有这样的:
l_ = l_.append(a_).reset(columns)
为附加数组设置新的列索引?好吧,显然这行不通!
所需的输出如下:
0 0
0 1.50 381
1 2.34 376
2 4.22 402
...
谢谢。
建议:
df_l = pd.DataFrame(l_)
df_1['a_'] = pd.Series(a_list, index=df_1.index)
示例 #1:
L = list(data)
A = list(data)
data_frame = pd.DataFrame(L)
data_frame['A'] = pd.Series(A, index=data_frame.index)
示例 #2 - 相同系列长度(创建系列并将索引设置为与现有数据框相同):
In [33]: L = list(item for item in range(10))
In [34]: A = list(item for item in range(10,20))
In [35]: data_frame = pd.DataFrame(L,columns=['L'])
In [36]: data_frame['A'] = pd.Series(A, index=data_frame.index)
In [37]: print data_frame
L A
0 0 10
1 1 11
2 2 12
3 3 13
4 4 14
5 5 15
6 6 16
7 7 17
8 8 18
9 9 19
示例 #3 - 不同系列长度(创建系列并让 pandas 处理索引匹配):
In [45]: not_same_length = list(item for item in range(50,55))
In [46]: data_frame['nsl'] = pd.Series(not_same_length)
In [47]: print data_frame
L A nsl
0 0 10 50
1 1 11 51
2 2 12 52
3 3 13 53
4 4 14 54
5 5 15 NaN
6 6 16 NaN
7 7 17 NaN
8 8 18 NaN
9 9 19 NaN
根据您的评论,您似乎想加入 lists.I 的列表,假设它们在列表结构中,因为 array()
不是 python 中的方法。为此,您需要执行以下操作:
In [63]: A = [[381],[376], [402], [400]]
In [64]: A = [inner_item for item in A for inner_item in item]
In [65]: print A
[381, 376, 402, 400]
然后使用新数组创建系列,并按照上述步骤添加到您的数据框中。
我有一个数组列表(一维 numpy 数组)(a_) 和一个列表 (l_),并且想要一个以它们作为列的 DataFrame。它们看起来像这样:
a_: [array([381]), array([376]), array([402]), array([400])...]
l_: [1.5,2.34,4.22,...]
我可以通过:
df_l = pd.DataFrame(l_) df_a = pd.DataFrame(a_) df = pd.concat([df_l, df_a], axis=1)
有没有更短的方法?我尝试使用 pd.append
:
df_l = pd.DataFrame(l_) df_l = df_l.append(a_)
但是,由于列索引均为 0,因此它会将 a_ 添加到数据框列的末尾,从而产生单列。有没有这样的:
l_ = l_.append(a_).reset(columns)
为附加数组设置新的列索引?好吧,显然这行不通!
所需的输出如下:
0 0 0 1.50 381 1 2.34 376 2 4.22 402
...
谢谢。
建议:
df_l = pd.DataFrame(l_)
df_1['a_'] = pd.Series(a_list, index=df_1.index)
示例 #1:
L = list(data)
A = list(data)
data_frame = pd.DataFrame(L)
data_frame['A'] = pd.Series(A, index=data_frame.index)
示例 #2 - 相同系列长度(创建系列并将索引设置为与现有数据框相同):
In [33]: L = list(item for item in range(10))
In [34]: A = list(item for item in range(10,20))
In [35]: data_frame = pd.DataFrame(L,columns=['L'])
In [36]: data_frame['A'] = pd.Series(A, index=data_frame.index)
In [37]: print data_frame
L A
0 0 10
1 1 11
2 2 12
3 3 13
4 4 14
5 5 15
6 6 16
7 7 17
8 8 18
9 9 19
示例 #3 - 不同系列长度(创建系列并让 pandas 处理索引匹配):
In [45]: not_same_length = list(item for item in range(50,55))
In [46]: data_frame['nsl'] = pd.Series(not_same_length)
In [47]: print data_frame
L A nsl
0 0 10 50
1 1 11 51
2 2 12 52
3 3 13 53
4 4 14 54
5 5 15 NaN
6 6 16 NaN
7 7 17 NaN
8 8 18 NaN
9 9 19 NaN
根据您的评论,您似乎想加入 lists.I 的列表,假设它们在列表结构中,因为 array()
不是 python 中的方法。为此,您需要执行以下操作:
In [63]: A = [[381],[376], [402], [400]]
In [64]: A = [inner_item for item in A for inner_item in item]
In [65]: print A
[381, 376, 402, 400]
然后使用新数组创建系列,并按照上述步骤添加到您的数据框中。