numpy 结构化数组中索引和切片的不同行为

Different behaviour of indexing and slicing in numpy structured arrays

假设你有一个结构化数组a:

import numpy as np

a = np.array([1, 2, 3, 4, 5, 6], dtype=[('val', 'i4')])
print(a)
[(1,) (2,) (3,) (4,) (5,) (6,)]

现在,如果我想将其中一个条目更改为不同的值,以下两种方式似乎是等效的(案例 I):

# both of these work
"""version a)"""
a['val'][1] = 10
print(a)
[( 1,) (10,) ( 3,) ( 4,) ( 5,) ( 6,)]

"""version b)"""
a[1]['val'] = 2
print(a)
[(1,) (2,) (3,) (4,) (5,) (6,)]

但是如果我们尝试更改多个条目(案例 II),这种歧义(不确定这是否是合适的术语)就会中断:

"""version a)"""
a['val'][[0, 1]] = 15
print(a)
[(15,) (15,) ( 3,) ( 4,) ( 5,) ( 6,)]
# this works

"""version b)"""
a[[0, 1]]['val'] = 5
print(a)
[(15,) (15,) ( 3,) ( 4,) ( 5,) ( 6,)]
# this has no effect

我想也许在第二种情况下,版本 b) 会创建一个新对象,因此为这些条目分配新值只会影响新对象而不影响原始对象。但在第一种情况下,版本 b) 似乎创建了一个新对象,因为以下两个语句 return False:

print(a[1]['val'] is a['val'][1])
print(a['val'][[0, 1]] is a[[0, 1]]['val'])

这种歧义只在第一种情况下出现,而在第二种情况下没有出现,这对我来说似乎是不一致的,即使至少令人困惑。我错过了什么?

很棒的观察。 Per numpy doc对于索引数组的所有情况,返回的是原始数据的副本,而不是切片的视图。 而单个元素索引 returns 一个视图。

另请注意,根据 scipy 文档,在结构化数组上调用字段会创建一个视图,并且使用整数进行索引会创建一个结构化标量,与其他 numpy 标量不同,结构化标量是可变的,就像对原始数组的视图一样,因此修改标量将修改原始数组。结构化标量还支持按字段名访问和分配

虽然它可能不共享内存(我不确定它的内部实现),但它就像一个视图并更改原始数组。因此,当您使用单个整数调用数组时,它就像一个视图并更改原始数组,而当您在整数索引上按数组调用它时,它会创建一个副本并且不会更改原始数组。