numpy.tolist() 和 list() 之间 precision/display 的区别

Question

这是对的跟进。

（这不是 is floating point math broken ? 顺便说一句的副本）

我正在将列表列表转换为 numpy 数组，然后尝试将其转换回 python 列表列表。

import numpy as np

x = [[  1.00000000e+00,   6.61560000e-13],
       [  2.00000000e+00,   3.05350000e-13],
       [  3.00000000e+00,   6.22240000e-13],
       [  4.00000000e+00,   3.08850000e-13],
       [  5.00000000e+00,   1.11170000e-10],
       [  6.00000000e+00,   3.82440000e-11],
       [  7.00000000e+00,   5.39160000e-11],
       [  8.00000000e+00,   1.75910000e-11],
       [  9.00000000e+00,   2.27330000e-10]]

x=np.array(x,np.float)
print([y.tolist() for y in x])
print([list(y) for y in x])

结果：

[[1.0, 6.6156e-13], [2.0, 3.0535e-13], [3.0, 6.2224e-13], [4.0, 3.0885e-13], [5.0, 1.1117e-10], [6.0, 3.8244e-11], [7.0, 5.3916e-11], [8.0, 1.7591e-11], [9.0, 2.2733e-10]]
[[1.0, 6.6155999999999996e-13], [2.0, 3.0535000000000001e-13], [3.0, 6.2223999999999998e-13], [4.0, 3.0884999999999999e-13], [5.0, 1.1117e-10], [6.0, 3.8243999999999997e-11], [7.0, 5.3915999999999998e-11], [8.0, 1.7591e-11], [9.0, 2.2733e-10]]

请注意，尝试匹配 python 本机类型也会失败（相同的行为）：

x=np.array(x,dtype=float)

因此，使用 numpy.tolist 将列表转换回正常的 python 列表会保留值，而通过调用 list 强制迭代会引入舍入误差。

有趣的事实：

str([y.tolist() for y in x])==str([list(y) for y in x]) 产生 False（如预期，不同的打印输出）
[y.tolist() for y in x]==[list(y) for y in x] 产生 True（到底是什么？？）

有什么想法吗？（使用 python 3.4 64 位 windows）

Answer 1

原因是这两种方法产生不同的类型，即使保存相同的值，它们也具有不同的字符串表示形式。调用 np.tolist 将数组元素转换为 float 数据类型，而调用 list 不会更改数据类型，导致 numpy.float64s:

import numpy as np

x = [[  1.00000000e+00,   6.61560000e-13],
       [  2.00000000e+00,   3.05350000e-13],
       [  3.00000000e+00,   6.22240000e-13],
       [  4.00000000e+00,   3.08850000e-13],
       [  5.00000000e+00,   1.11170000e-10],
       [  6.00000000e+00,   3.82440000e-11],
       [  7.00000000e+00,   5.39160000e-11],
       [  8.00000000e+00,   1.75910000e-11],
       [  9.00000000e+00,   2.27330000e-10]]

x=np.array(x,np.float)

print(type(x[0].tolist()[0]))     # `float`
print(type(list(x[0])[0]))        # `numpy.float64`

由于它们具有不同的字符串表示形式（float 被四舍五入，而 numpy.float64 打印出完整的精度），打印出不同的结果并且 str([y.tolist() for y in x])==str([list(y) for y in x]) 的比较失败，而值明智的比较通过。

numpy.tolist() 和 list() 之间 precision/display 的区别

Difference of precision/display between numpy.tolist() and list()

python

numpy

floating-accuracy