为元组数组创建布尔掩码

Create boolean mask for an array of tuples

我有一个二维 numpy 数组,其形状为 (3, 3) 且 dtype=object,其元素是形式为 (str, str, float) 的元组。

template = ('Apple', 'Orange', 5.0)
my_array = np.array([None] * 9).reshape((3,3))

for i in range(my_array.shape[0]):
    for j in range(my_array.shape[1]):
        my_array[i, j] = template

但是当我尝试获取布尔掩码时

print(my_array == template)

答案全为假

[[False False False]
 [False False False]
 [False False False]]

但是元素方面的比较仍然有效

print(my_array[0,0] == template) # This prints True

为什么布尔掩码 return 都是 False,我该如何让它工作?

P.S。我已经搜索了相关主题,但无法使用任何...


Restructuring Array of Tuples

这里发生的是 Python tuples are compared by position. 所以当你这样做时

my_array == template

你实际上在做什么(按行)是:

('Apple', 'Orange', 5.0) == 'Apple'
('Apple', 'Orange', 5.0) == 'Orange'
('Apple', 'Orange', 5.0) == 5.0

要验证情况是否如此,请尝试使用以下示例进行试验:

>>> other_array = np.array(['Apple', 'Orange', 5.0] * 3).reshape(3,3)
>>> other_array
array([['Apple', 'Orange', '5.0'],
       ['Apple', 'Orange', '5.0'],
       ['Apple', 'Orange', '5.0']], dtype='<U6')
>>> other_array == template
array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]])

我不知道有什么简单的方法可以解决这个问题并使直接相等比较起作用。如果黑客足够并且你的数组不是太大你可以尝试:

mask = np.array(list(map(lambda x: x == template,
                         my_array.flatten()))).reshape(my_array.shape)

mask = np.array([x == template for x in my_array.flatten()]).reshape(my_array.shape)

你需要一个元组数组是有原因的吗?你不能在你的数组中有另一个维度,或者可以使用 pandas 作为你的分类变量吗?