Python 中的可变和不可变

Mutable and Immutable in Python

我是 Python 的新手,正在尝试了解可变对象和不可变对象之间的区别。 Python 中的一种可变类型是列表。假设 L = [1,2,3],那么 L 有一个指向对象 [1,2,3] 的 id。如果修改了 [1,2,3] 的内容,那么 L 仍然保留相同的 id。换句话说,即使对象的大小和内容已更改,L 仍与同一对象相关联。

对于不可变对象,我的理解是不允许修改对象。因此,如果一个变量被重新分配了一个新值,那么该变量将绑定到一个具有不同 id 的新对象。我希望字符串以类似的方式运行。然而我试图修改一个字符串,但字符串 id 没有改变。

string = "blue"
for i in range(10):
    string = string + str(i)
    print("string id after {}th iteration: {}".format(i,id(string)))


string id after 0th iteration: 46958272
string id after 1th iteration: 46958272
string id after 2th iteration: 46958272
string id after 3th iteration: 47077400
string id after 4th iteration: 47077400
string id after 5th iteration: 47077400
string id after 6th iteration: 47077400
string id after 7th iteration: 47077400
string id after 8th iteration: 47077400
string id after 9th iteration: 47077400

您确实不应该连续两次看到相同的 ID,但 CPython 对字符串连接进行了优化 +,但它并没有完全遵守它应该遵守的所有规则。

当 CPython 看到 x = x + somethingx += something 形式的操作时,如果 x 指的是一个字符串并且 x 仅包含 引用该字符串,然后 CPython 将使用 realloc 增长字符串而不是创建新的字符串对象。根据可用内存的详细信息,realloc 可能会就地调整已分配内存的大小,或者可能会分配新内存。如果它调整分配大小,对象的 id 保持不变。您可以在 Python/ceval.c.

中查看 unicode_concatenate 中的实现

这个优化大部分很好,因为引用计数检查确保它的行为大部分就好像字符串真的是不可变的并且一个新字符串是创建。但是,在 x = x + stuff 中,旧字符串和新字符串 应该 有短暂的重叠生命周期,因为新字符串应该在赋值结束旧字符串的生命周期之前就已经存在,所以应该 ID 值不可能相等。

id 是优化与未发生字符串突变时明显不同的少数几种方式之一。语言开发人员似乎已经决定接受这一点。