Numpy 深拷贝仍在改变原始数组

Numpy deep copy still altering original array

据我了解,ndarray 的深层副本应该创建 ndarray 的第二次迭代,以便更改任一数组都不会影响另一个数组的内容。但是,在下面的代码中,我原来的ndarray被改变了:

print(data[3])   #[array([[0.00000000e+00, 3.29530000e+04],
   #[4.00066376e-04, 3.29530000e+04],
   #[8.00132751e-04, 3.29530000e+04],
   #...,
   #[1.28784461e+03, 3.47140000e+04],
   #[1.28784621e+03, 3.57750000e+04],
   #[1.28785381e+03, 1.92450000e+04]]),
   #'CH4.VDC1']

new = np.empty_like(data)
new[:] = data
new[3][0][:,1] = 4/16421 * (data[3][0][:,1] - 33563)

print(data[3])  #[array([[ 0.00000000e+00, -1.48590220e-01],
   #[ 4.00066376e-04, -1.48590220e-01],
   #[ 8.00132751e-04, -1.48590220e-01],
   #...,
   #[ 1.28784461e+03,  2.80372694e-01],
   #[ 1.28784621e+03,  5.38822240e-01],
   #[ 1.28785381e+03, -3.48772913e+00]]),
   #'CH4.VDC1']

数组为混合型(5,2)数组,内部有(largenumber,2)子数组。我只是想更改子数组,但我想知道深层副本是否也扩展到该子数组。我有 运行

np.shares_memory(new, data) #false

np.might_share_memory(new,data) #false

可能还需要注意的是,我在 jupyter notebook 中 运行ning 这个。虽然我无法想象为什么它会改变任何事情。您可以使用以下方法重新创建数据:

np.array([[[[0.00000000e+00, 2.82540000e+04],
[4.00066376e-04, 2.82530000e+04],
[8.00132751e-04, 2.82520000e+04],
[1.28784461e+03, 4.61170000e+04],
[1.28784621e+03, 3.38280000e+04],
[1.28785381e+03, 3.38230000e+04]],
'CH1.Bx'],
[[[0.00000000e+00, 2.00400000e+04],
[4.00066376e-04, 2.00400000e+04],
[8.00132751e-04, 2.00410000e+04],
[1.28784461e+03, 1.81600000e+04],
[1.28784621e+03, 1.80830000e+04],
[1.28785381e+03, 4.80200000e+03]],
'CH2.By'],
[array([[0.00000000e+00, 3.82520000e+04],
[4.00066376e-04, 3.82510000e+04],
[8.00132751e-04, 3.82510000e+04],
[1.28784461e+03, 3.42810000e+04],
[1.28784621e+03, 3.42820000e+04],
[1.28785381e+03, 3.40380000e+04]]),
'CH3.Bz'],
[[[ 0.00000000e+00, -1.48590220e-01],
[ 4.00066376e-04, -1.48590220e-01],
[ 8.00132751e-04, -1.48590220e-01],
[ 1.28784461e+03,  2.80372694e-01],
[ 1.28784621e+03,  5.38822240e-01],
[ 1.28785381e+03, -3.48772913e+00]],
'CH4.VDC1'],
[[[0.00000000e+00, 3.26760000e+04],
[4.00066376e-04, 3.26760000e+04],
[8.00132751e-04, 3.26750000e+04],
[1.28784981e+03, 3.40450000e+04],
[1.28785061e+03, 3.40420000e+04],
[1.28785141e+03, 3.40390000e+04]],
'CH5.VDC2']], dtype=object)`

你应该使用 copy's deepcopy,[:] 不做深层复制:

In [11]: a = [[1], 2]

In [12]: b = a[:]

In [13]: from copy import deepcopy
    ...: c = deepcopy(a)

In [14]: b[0].append(3)

In [15]: a
Out[15]: [[1, 3], 2]

In [16]: c
Out[16]: [[1], 2]

这看起来不像是您从那里开始的数组。目前尚不清楚 data 是什么,但 data[3] 是一个包含数组和字符串的 2 元素列表,据此判断, data 可能是另一个列表,或者可能是 object-dtype数组。

您尝试进行深层复制:

new = np.empty_like(data)
new[:] = data

不是深拷贝。它将是大多数普通数组的副本(deep/shallow 对大多数数组是等效的),但不是列表的深层副本,也不是 object-dtype 数组的深层副本。它将创建一个新的 object-dtype 数组并用对 data.

的单元格引用的相同对象的引用填充它

您或许应该选择一种更好的方式来组织您的数据。这种数据结构不是使用 NumPy 的有效方式,它会导致更多的问题。也就是说,如果您想对其进行深度复制,copy.deepcopy 可能是您最好的选择。