将单独的一维 np.arrays 转换为二维列表 np.arrays

convert separate 1D np.arrays into a list of 2D np.arrays

我正在尝试将三个一维数组转换为一个二维数组列表。我设法通过创建一个空的 ndarray 并逐行填充它来做到这一点。有人可以告诉我更优雅的方法吗?

import numpy as np
import pandas as pd
one=np.arange(1,4,1)
two=np.arange(10,40,10)
three=np.arange(100,400,100)
df=pd.DataFrame({'col1':one,'col2':two,'col3':three})

desired_output=[np.array([[1.,10.],[1.,100.]]),np.array([[2.,20.],[2.,200.]]),np.array([[3.,30.],[3.,300.]])]

当前有效的不雅方法:

output=[]
for i in range(len(df)):
    temp=np.zeros(shape=(2,2))
    temp[0][0]=df.iloc[i,0]
    temp[0][1]=df.iloc[i,1]
    temp[1][0]=df.iloc[i,0]
    temp[1][1]=df.iloc[i,2]
    output.append(temp)

所以首先你可以通过简单地执行以下操作从 df 值中获取数组

In [61]:
arr = df.values
arr
Out[61]:
array([[  1,  10, 100],
       [  2,  20, 200],
       [  3,  30, 300]])

然后再次添加数组中的第一列

In [73]:
arr_mod = np.hstack((arr , arr[: , 0][:, np.newaxis]))
arr_mod
Out[73]:
array([[  1,  10, 100,   1],
       [  2,  20, 200,   2],
       [  3,  30, 300,   3]])

将您刚刚添加的列与数组中的最后一列交换

In [74]:
arr_mod[: , [2 , 3]] = arr_mod [:  , [3 , 2]]
arr_mod
Out[74]:
array([[  1,  10,   1, 100],
       [  2,  20,   2, 200],
       [  3,  30,   3, 300]])

然后将这个 2d array 转换为 3d array 并将其转换为 list

In [78]:
list(arr_mod.reshape( -1, 2 , 2))
Out[78]:
[array([[  1,  10],
        [  1, 100]]), array([[  2,  20],
        [  2, 200]]), array([[  3,  30],
        [  3, 300]])]

这是一种使用 np.column_stack and np.vsplit -

的方法
arr2D = np.column_stack((df['col1'],df['col2'],df['col1'],df['col3']))
out_list = np.vsplit(arr2D.reshape(-1,2),arr2D.shape[0])

基本上,我们使用 np.column_stackcolumn-1column-2 堆叠在一起,然后再次将 column-1column-3 堆叠起来,得到一个二维 NumPy 数组 arr2D 的形状 N x 4。接下来,我们将 arr2D 重塑为 2*N X 2 数组,并用 np.vsplit 沿行拆分,得到预期的 2D 数组列表。

样本运行-

>>> df
   col1  col2  col3
0     1    10   100
1     2    20   200
2     3    30   300
3     4    40   400
4     5    50   500
5     6    60   600
>>> arr2D = np.column_stack((df['col1'],df['col2'],df['col1'],df['col3']))
>>> out_list = np.vsplit(arr2D.reshape(-1,2),arr2D.shape[0])
>>> print out_list
[array([[  1,  10],
       [  1, 100]]), array([[  2,  20],
       [  2, 200]]), array([[  3,  30],
       [  3, 300]]), array([[  4,  40],
       [  4, 400]]), array([[  5,  50],
       [  5, 500]]), array([[  6,  60],
       [  6, 600]])]