Python 基本类型（特别是 int 和 float）的内存使用

Question

这是来自 Python 3.8.0 解释器的示例（但是，它在 3.7.5 中类似）

>>> import sys
>>> sys.getsizeof(int)
416
>>> sys.getsizeof(float)
416
>>> sys.getsizeof(list)
416
>>> sys.getsizeof(tuple)
416
>>> sys.getsizeof(dict)
416
>>> sys.getsizeof(bool)
416

getsizeof() returns 对象消耗了多少字节 Python 以及垃圾收集器开销（参见 here）。 basic python 类消耗相同内存量的原因是什么？

如果我们看一下这些实例类

>>> import sys
>>> sys.getsizeof(int())
24
>>> sys.getsizeof(float())
24

默认参数是0，这两个实例对该参数的内存使用量相同。但是，如果我尝试添加一个参数

>>> sys.getsizeof(int(1))
28
>>> sys.getsizeof(float(1))
24

这就是奇怪的地方。为什么int类型实例内存占用增加，float类型实例内存占用不增加？

Answer 1

查看 the docs，重要的是要观察到：

Only the memory consumption directly attributed to the object is accounted for, not the memory consumption of objects it refers to.

那么从sys.getsizeof(int(1))的返回值大于sys.getsizeof(float(1))的返回值，你能推断出什么？

简单地说，表示 int 比表示 float 需要更多的内存。这令人惊讶吗？好吧，可能不是，如果我们可以期望 "do more things" 与 int 相比，我们可以用 float 做到。我们可以通过查看属性的数量来衡量 "amount of functionality" 的第一个程度：

>>> len(dir(int))
70
>>> len(dir(float))
57

Answer 2

简而言之，这一切都归结为 Python 如何表示任意长整数。 float() 类型表示（有限）就像 C double.

在 CPython 实现中，每个对象 (source) 都以引用计数和指向该对象类型对象的指针开始。那是 16 个字节。

Float 对象将其数据存储为 C double (source)，即 8 个字节。所以 16 + 8 = 24 字节 用于浮动对象。

使用整数，情况更复杂。整数对象表示为可变大小的对象 (source)，它为 16 个字节添加了另外 8 个字节。数字表示为数组。根据平台的不同，Python 使用具有 30 位数字的 32 位无符号整数数组或具有 15 位数字的 16 位无符号整数数组。所以对于小整数，数组中只有一个 32 位整数，所以再添加 4 个字节 = 16 + 8 + 4 = 28 个字节.

如果要表示更大的整数，大小会增加：

sys.getsizeof(int(2**32))  # prints 32 (24 + 2*4 bytes)
sys.getsizeof(int(2**64))  # prints 36 (24 + 3*4 bytes)

编辑：

使用 sys.getsizeof(int)，您将获得 class 的大小，而不是实例的大小class。 float、bool、...

也是如此

print(type(int))  # prints <class 'type'>

如果您查看 source，就会发现引擎盖下有很多东西。在我的 Python 3.6.9 (Linux/64bit) 版本中，这会打印 400 个字节。

Python 基本类型（特别是 int 和 float）的内存使用

Memory usage of Python base types (particulary int and float)

python

memory-management

python-internals