Python/Numpy:向量化二维数组中的重复行插入
Python/Numpy: Vectorizing repeated row insertion in a 2D array
是否可以向量化行的插入?
我有一个大的 2D numpy 数组 arr
(下图)和一个列表 indices
。对于 indices
中 arr
的每个索引,我想将该索引处的行插入同一索引处的 arr
行 5 次。
indices = [2, 4, 5, 9, 11, 12, 16, 18, 19]
目前我只是遍历所有索引并插入新行。这种方法对于包含数千行的大型列表来说速度很慢,因此出于性能原因,我想知道是否可以对这种多点平铺类型插入进行矢量化?
arr = [
[' ', ' ', 'd'],
[' ', 'd', ' '],
[' ', 'd', 'd'], # <-- reinsert arr[2] here 5 times
['d', ' ', ' '],
['d', ' ', 'd'], # <-- reinsert arr[4] here 5 times
['d', 'd', ' '], # <-- reinsert arr[5] here 5 times
['d', 'd', 'd'],
[' ', ' ', 'e'],
[' ', 'e', ' '],
[' ', 'e', 'e'], # <-- reinsert arr[9] here 5 times
['e', ' ', ' '],
['e', ' ', 'e'], # <-- reinsert arr[11] here 5 times
['e', 'e', ' '], # <-- reinsert arr[12] here 5 times
['e', 'e', 'e'],
[' ', ' ', 'f'],
[' ', 'f', ' '],
[' ', 'f', 'f'], # <-- reinsert arr[16] here 5 times
['f', ' ', ' '],
['f', ' ', 'f'], # <-- reinsert arr[18] here 5 times
['f', 'f', ' '] # <-- reinsert arr[19] here 5 times
]
首次插入所需结果的示例:
arr = [
[' ', ' ', 'd'],
[' ', 'd', ' '],
[' ', 'd', 'd'], # <-- arr[2]
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
['d', ' ', ' ']
#...
]
您可以为此使用 np.repeat
:
indices = [2, 4, 5, 9, 11, 12, 16, 18, 19]
rpt = np.ones(len(arr), dtype=int)
rpt[indices] = 5
np.repeat(arr, rpt, axis=0)
是否可以向量化行的插入?
我有一个大的 2D numpy 数组 arr
(下图)和一个列表 indices
。对于 indices
中 arr
的每个索引,我想将该索引处的行插入同一索引处的 arr
行 5 次。
indices = [2, 4, 5, 9, 11, 12, 16, 18, 19]
目前我只是遍历所有索引并插入新行。这种方法对于包含数千行的大型列表来说速度很慢,因此出于性能原因,我想知道是否可以对这种多点平铺类型插入进行矢量化?
arr = [
[' ', ' ', 'd'],
[' ', 'd', ' '],
[' ', 'd', 'd'], # <-- reinsert arr[2] here 5 times
['d', ' ', ' '],
['d', ' ', 'd'], # <-- reinsert arr[4] here 5 times
['d', 'd', ' '], # <-- reinsert arr[5] here 5 times
['d', 'd', 'd'],
[' ', ' ', 'e'],
[' ', 'e', ' '],
[' ', 'e', 'e'], # <-- reinsert arr[9] here 5 times
['e', ' ', ' '],
['e', ' ', 'e'], # <-- reinsert arr[11] here 5 times
['e', 'e', ' '], # <-- reinsert arr[12] here 5 times
['e', 'e', 'e'],
[' ', ' ', 'f'],
[' ', 'f', ' '],
[' ', 'f', 'f'], # <-- reinsert arr[16] here 5 times
['f', ' ', ' '],
['f', ' ', 'f'], # <-- reinsert arr[18] here 5 times
['f', 'f', ' '] # <-- reinsert arr[19] here 5 times
]
首次插入所需结果的示例:
arr = [
[' ', ' ', 'd'],
[' ', 'd', ' '],
[' ', 'd', 'd'], # <-- arr[2]
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
[' ', 'd', 'd'], # <-- new insert
['d', ' ', ' ']
#...
]
您可以为此使用 np.repeat
:
indices = [2, 4, 5, 9, 11, 12, 16, 18, 19]
rpt = np.ones(len(arr), dtype=int)
rpt[indices] = 5
np.repeat(arr, rpt, axis=0)