在for循环中删除np数组中的行

Question

我正在尝试删除列表 'a' 中包含的多个二维数组中包含一个或更少非零元素的所有行。

当我运行它在 'i' 循环之外时，此方法有效，但作为一个整体无效。我知道我不能删除我正在迭代的行，但我相信在这种情况下我不会这样做，因为我只是删除 a 中包含的数组中的行，而不是数组本身。

for i in range(len(a)):
  del_idx=[]
  for j in range(len(a[i])):
    nonzero=np.nonzero(a[i][j])
    nonzero_len=len(nonzero[0]) #because np.nonzero outputs a tuple
    if nonzero_len<=1:
        del_idx.append(j)
    else:
        continue
  np.delete(a[i],(del_idx),axis=0)

有人知道这是怎么回事吗？如果这真的不起作用，我如何在不使用循环的情况下删除这些元素？这是 Python 2.7

谢谢！

Answer 1

当向量化操作可用时，您应该致力于避免 for 使用 NumPy 循环。例如，这里可以使用布尔索引：

import numpy as np

np.random.seed(0)

A = np.random.randint(0, 2, (10, 3))

res = A[(A != 0).sum(1) > 1]

array([[0, 1, 1],
       [0, 1, 1],
       [1, 1, 1],
       [1, 1, 0],
       [1, 1, 0],
       [0, 1, 1],
       [1, 1, 0]])

可以对数组列表中的每个数组应用相同的逻辑。

Answer 2

您可以使用 np.where() 进行索引：

a = np.random.randint(0, 2, size=(10,10))
# array([[1, 1, 0, 0, 0, 0, 0, 1, 1, 1],
#    [1, 0, 0, 0, 1, 1, 1, 1, 0, 1],
#    [1, 0, 1, 0, 0, 1, 0, 0, 0, 1],
#    [1, 0, 0, 1, 0, 1, 0, 1, 1, 0],
#    [1, 0, 0, 0, 1, 0, 1, 1, 0, 1],
#    [0, 0, 1, 1, 1, 0, 1, 0, 0, 0],
#    [1, 0, 0, 1, 1, 0, 0, 1, 1, 0],
#    [0, 0, 0, 1, 0, 1, 0, 1, 1, 1],
#    [0, 0, 1, 1, 0, 0, 1, 0, 1, 0],
#    [1, 1, 0, 0, 0, 1, 0, 0, 1, 1]])

np.where(np.count_nonzero(a, axis=1)<5)    # In your case, should be > 1
# (array([2, 5, 8]),)

a[np.where(np.count_nonzero(a, axis=1)<5)] # Returns the array you wanted
# array([[1, 0, 1, 0, 0, 1, 0, 0, 0, 1],
#    [0, 0, 1, 1, 1, 0, 1, 0, 0, 0],
#    [0, 0, 1, 1, 0, 0, 1, 0, 1, 0]])

在for循环中删除np数组中的行

Deleting rows in np array inside a for loop

python

arrays

numpy

rowdeleting