Python3 多重赋值和内存地址
Python3 multiple assignment and memory address
阅读this and 后,与我的问题非常相似,我仍然无法理解以下行为:
a = 257
b = 257
print(a is b) #False
a, b = 257, 257
print(a is b) #True
打印 id(a)
和 id(b)
时,我可以看到在不同的行中分配值的变量具有不同的 ID,而对于多重分配,两个值具有相同的 ID:
a = 257
b = 257
print(id(a)) #139828809414512
print(id(b)) #139828809414224
a, b = 257, 257
print(id(a)) #139828809414416
print(id(b)) #139828809414416
但是无法通过对相同值的多次赋值总是创建指向相同 ID 的指针来解释此行为,因为:
a, b = -1000, -1000
print(id(a)) #139828809414448
print(id(b)) #139828809414288
是否有明确的规则来解释变量何时相同 id
何时不相同?
编辑
相关信息:本题代码为运行交互模式(ipython3)
任何此类规则都是特定于实现的。例如,CPython 为小整数(-5 到 256)预分配 int
个对象作为性能优化。
唯一的一般规则是假定对文字的任何使用都会生成一个新对象。
这是因为 python 解释器在 UNPACK_SEQUENCE
时进行了优化,在加载常量值的过程中。当 python 在解包过程中遇到可迭代对象时,它不会多次加载重复的对象,而是只保留第一个对象并将所有重复的变量名分配给一个指针(在 CPython 实现中)。因此,您所有的变量都将成为对一个对象的相同引用。在 python 级别,您可以将此行为视为使用字典作为不保留重复键的名称空间。
换句话说,您的解包相当于以下命令:
a = b = 257
关于负数,在 python 2.X 中没有任何区别,但在 python 3.X 中似乎对于小于 -5 的数字python 将在解包期间创建新对象:
>>> a, b = -6, -6
>>> a is b
False
>>> a, b = -5, -5
>>>
>>> a is b
True
这是由于字节码编译器中的常量折叠优化。当字节码编译器编译一批语句时,它 uses a dict 跟踪它看到的常量。此字典自动合并任何等效常量。
下面是负责记录和编号常量(以及一些相关职责)的例程:
static int
compiler_add_o(struct compiler *c, PyObject *dict, PyObject *o)
{
PyObject *t, *v;
Py_ssize_t arg;
t = _PyCode_ConstantKey(o);
if (t == NULL)
return -1;
v = PyDict_GetItem(dict, t);
if (!v) {
arg = PyDict_Size(dict);
v = PyInt_FromLong(arg);
if (!v) {
Py_DECREF(t);
return -1;
}
if (PyDict_SetItem(dict, t, v) < 0) {
Py_DECREF(t);
Py_DECREF(v);
return -1;
}
Py_DECREF(v);
}
else
arg = PyInt_AsLong(v);
Py_DECREF(t);
return arg;
}
您可以看到它只添加一个新条目并在找不到已存在的等效常量时分配一个新数字。 (_PyCode_ConstantKey
位确保 0.0
、-0.0
和 0
被认为是不等价的。)
在交互模式下,每次解释器实际上必须 运行 您的命令时,批处理就会结束,因此常量折叠通常不会跨命令发生:
>>> a = 1000
>>> b = 1000
>>> a is b
False
>>> a = 1000; b = 1000 # 1 batch
>>> a is b
True
在一个脚本中,所有顶级语句都是一批的,所以more constant folding happens:
a = 257
b = 257
print a is b
在脚本中,这会打印 True
。
函数代码的常量与函数外部代码分开跟踪,这限制了常量折叠:
a = 257
def f():
b = 257
print a is b
f()
Even in a script,这会打印 False
.
阅读this and
a = 257
b = 257
print(a is b) #False
a, b = 257, 257
print(a is b) #True
打印 id(a)
和 id(b)
时,我可以看到在不同的行中分配值的变量具有不同的 ID,而对于多重分配,两个值具有相同的 ID:
a = 257
b = 257
print(id(a)) #139828809414512
print(id(b)) #139828809414224
a, b = 257, 257
print(id(a)) #139828809414416
print(id(b)) #139828809414416
但是无法通过对相同值的多次赋值总是创建指向相同 ID 的指针来解释此行为,因为:
a, b = -1000, -1000
print(id(a)) #139828809414448
print(id(b)) #139828809414288
是否有明确的规则来解释变量何时相同 id
何时不相同?
编辑
相关信息:本题代码为运行交互模式(ipython3)
任何此类规则都是特定于实现的。例如,CPython 为小整数(-5 到 256)预分配 int
个对象作为性能优化。
唯一的一般规则是假定对文字的任何使用都会生成一个新对象。
这是因为 python 解释器在 UNPACK_SEQUENCE
时进行了优化,在加载常量值的过程中。当 python 在解包过程中遇到可迭代对象时,它不会多次加载重复的对象,而是只保留第一个对象并将所有重复的变量名分配给一个指针(在 CPython 实现中)。因此,您所有的变量都将成为对一个对象的相同引用。在 python 级别,您可以将此行为视为使用字典作为不保留重复键的名称空间。
换句话说,您的解包相当于以下命令:
a = b = 257
关于负数,在 python 2.X 中没有任何区别,但在 python 3.X 中似乎对于小于 -5 的数字python 将在解包期间创建新对象:
>>> a, b = -6, -6
>>> a is b
False
>>> a, b = -5, -5
>>>
>>> a is b
True
这是由于字节码编译器中的常量折叠优化。当字节码编译器编译一批语句时,它 uses a dict 跟踪它看到的常量。此字典自动合并任何等效常量。
下面是负责记录和编号常量(以及一些相关职责)的例程:
static int
compiler_add_o(struct compiler *c, PyObject *dict, PyObject *o)
{
PyObject *t, *v;
Py_ssize_t arg;
t = _PyCode_ConstantKey(o);
if (t == NULL)
return -1;
v = PyDict_GetItem(dict, t);
if (!v) {
arg = PyDict_Size(dict);
v = PyInt_FromLong(arg);
if (!v) {
Py_DECREF(t);
return -1;
}
if (PyDict_SetItem(dict, t, v) < 0) {
Py_DECREF(t);
Py_DECREF(v);
return -1;
}
Py_DECREF(v);
}
else
arg = PyInt_AsLong(v);
Py_DECREF(t);
return arg;
}
您可以看到它只添加一个新条目并在找不到已存在的等效常量时分配一个新数字。 (_PyCode_ConstantKey
位确保 0.0
、-0.0
和 0
被认为是不等价的。)
在交互模式下,每次解释器实际上必须 运行 您的命令时,批处理就会结束,因此常量折叠通常不会跨命令发生:
>>> a = 1000
>>> b = 1000
>>> a is b
False
>>> a = 1000; b = 1000 # 1 batch
>>> a is b
True
在一个脚本中,所有顶级语句都是一批的,所以more constant folding happens:
a = 257
b = 257
print a is b
在脚本中,这会打印 True
。
函数代码的常量与函数外部代码分开跟踪,这限制了常量折叠:
a = 257
def f():
b = 257
print a is b
f()
Even in a script,这会打印 False
.