什么是实现描述符的正确方法?
Whats the correct way to implement a descriptor?
考虑此代码:运行 on python 3.6
Bar
赋值给描述符实例
Bat
将值分配给包含 class 的实例。
我见过的代码示例(并且习惯了我无尽的挫败感)使用 Bar
示例。比如这个site
来自 python docs
从使用 Bar
示例的输出可以看出,class 的两个实例不能使用相同的描述符。
还是我遗漏了什么?
class DescriptorA(object):
value = None
def __get__(self, instance, owner):
return self.value
def __set__(self, instance, value):
self.value = value
class DescriptorB(object):
_value = None
def __get__(self, instance, owner):
return instance._value
def __set__(self, instance, value):
instance._value = value
class Bar(object):
foo = DescriptorA()
def __init__(self, foo):
self.foo = foo
class Bat(object):
foo = DescriptorB()
def __init__(self, foo):
self.foo = foo
print('BAR')
a = Bar(1)
print('a', a.foo)
b = Bar(2)
print('b', b.foo)
print('Checking a')
print('a', a.foo)
print('BAT')
c = Bat(3)
print('c', c.foo)
d = Bat(4)
print('d', d.foo)
print('Checking c')
print('c', c.foo)
输出
BAR
a 1
b 2
Checking a
a 2
BAT
c 3
d 4
Checking c
c 3
更新
只是想补充一下。为了回应好的答案。当不使用描述符,但仍然使用 class 属性时。我们得到不同的行为。这就是为什么我犯了使用 DescriptorA
的错误。
class Bar(object):
foo = None
def __init__(self, foo):
self.foo = foo
class Bat(object):
foo = None
def __init__(self, foo):
self.foo = foo
print('BAR')
a = Bar(1)
print('a', a.foo)
b = Bar(2)
print('b', b.foo)
print('Checking a')
print('a', a.foo)
print('BAT')
c = Bat(3)
print('c', c.foo)
d = Bat(4)
print('d', d.foo)
print('Checking c')
print('c', c.foo)
BAR
a 1
b 2
Checking a
a 1
BAT
c 3
d 4
Checking c
c 3
一个描述符在 class 级别定义,并且在 class 中只有该描述符的一个实例。因此,在第一个描述符中,即 DescriptorA
,您将值作为变量存储在描述符上,而不是 instance
对象上。显然,当您实例化另一个实例时,该值将被覆盖。
您在描述符中存储的任何值对于分配给描述符的 class 的所有实例都将保持不变。这就是 DescriptorB
起作用的原因,并且是使用描述符而不是第一个描述符的正确方法,除非您的用例需要变量,这些变量应该在各个实例中保持不变。
描述符是 class 属性(它们必须是描述符协议才能工作)。作为 class 属性意味着 class 的所有实例共享一个描述符实例(并且它是子 classes),所以你观察到 class Bar
和 DescriptorA
是预期的行为。
这并不意味着 "two instances of a class can't use the same descriptor (instance)" - 他们确实这样做了,这就是为什么你有这种行为 - 但你不能在你的描述符实例上存储每个实例的值,至少不是那么简单。
一个可能的解决方案是在您的描述符中维护一个 id(instance):instance_value
映射,即:
class DescriptorA(object):
def __init__(self, default=None):
self._values = {}
self._default = default
def __get__(self, instance, cls):
if instance is None:
return self
return self._values.get(id(instance), self._default)
def __set__(self, instance, value):
self._values[id(instance)] = value
但这有很多缺点,第一个明显的缺点是当实例被垃圾收集时,您的 _values
dict 不会被清除。它可能最终会在一个漫长的 运行 过程中吃掉相当多的 ram...
编辑:更新中的代码是 而不是 使用 class 属性。具有同名 class 属性在这里无关紧要 - 初始化程序设置了一个 value
instance 属性,它隐藏了 class 级别的属性(实际上从来没有在您的代码片段中使用)。
如果你想要一个具有 class 属性的有意义的例子,使用一个可变对象并改变它而不是创建一个实例属性:
>>> class Foo(object):
... bar = []
... def __init__(self, baaz):
... self.baaz = baaz
... self.bar.append(baaz)
...
>>> f1 = Foo("foo1")
>>> f1.baaz
'foo1'
>>> f1.bar
['foo1']
>>> f2 = Foo("foo2")
>>> f1.baaz
'foo1'
>>> f2.baaz
'foo2'
>>> f1.bar
['foo1', 'foo2']
>>> f2.bar
['foo1', 'foo2']
>>>
这实际上取决于您的用例如何存储变量。
我们有 4 个对象,每个对象都有自己的一组变量:
- 描述符class
- 描述符的实例
- 正常class
- 正常实例class
通常描述符 实例 存储在 "normal class" 中,因为在实例中存储描述符时不会调用描述符协议。您还可以 "go meta" 并在 metaclasses 上使用描述符或在描述符中使用描述符,但为了保持简短和理智,让我们忽略这些(这并不难,但可能有点太宽泛了)。
因此,如果您 DescriptorA
您存储:
value = None
描述符 class
value = ?
在描述符实例中(至少在调用__set__
之后至少一次
foo = descriptor instance
正常 class
- class 实例中没有任何内容
在 DescriptorB
的情况下,您存储:
_value = None
描述符 class
- 描述符实例中没有任何内容
foo = descriptor instance
正常 class
_value = ?
在你正常的实例中 class
看出区别了吗?在第一种情况下,正常 class 的不同实例访问相同的描述符实例,因此所有内容都是共享的。在第二种情况下,您将所有内容都存储在 class 的实例中,而在描述符实例中没有任何内容,因此不会共享任何内容。
请注意,您的 DescriptorB
看起来很奇怪,为什么在您从不使用它的情况下将 _value = None
存储在描述符 class 中?请记住,您访问的是普通 class 实例的 _value
,而不是 __get__
!
中描述符实例的 _value
正如我之前所说,选择哪种方法取决于您的用例。通常您希望拥有一些共享属性和一些实例属性。但是您也可以在描述符的所有实例之间共享属性,并且假设您还可以在 __get__
中访问普通 class 实例的类型并在 __set__
中使用 type(instance)
你还可以修改 class 普通 class.
的属性
例如 Python 文档中的示例:
class RevealAccess(object):
"""A data descriptor that sets and returns values
normally and prints a message logging their access.
"""
def __init__(self, initval=None, name='var'):
self.val = initval
self.name = name
def __get__(self, obj, objtype):
print('Retrieving', self.name)
return self.val
def __set__(self, obj, val):
print('Updating', self.name)
self.val = val
>>> class MyClass(object):
... x = RevealAccess(10, 'var "x"')
... y = 5
...
他们故意为 class 变量 创建了一个描述符。在那种情况下,就没有 "instance" 并且它是否被共享并不重要,因为默认情况下 class 变量将由实例共享。这意味着即使您在一个实例上设置变量,它也会为所有其他实例发生变化。
因此,如果您不想共享描述符实例变量,则不应真正使用它。但是,您应该将它们用于应该共享的所有内容(例如属性的 name 等)。
可能也很有趣的是 "way" Python 查找属性。我通常会发现这张来自 this blog 的图片非常有用:
考虑此代码:运行 on python 3.6
Bar
赋值给描述符实例
Bat
将值分配给包含 class 的实例。
我见过的代码示例(并且习惯了我无尽的挫败感)使用 Bar
示例。比如这个site
来自 python docs
从使用 Bar
示例的输出可以看出,class 的两个实例不能使用相同的描述符。
还是我遗漏了什么?
class DescriptorA(object):
value = None
def __get__(self, instance, owner):
return self.value
def __set__(self, instance, value):
self.value = value
class DescriptorB(object):
_value = None
def __get__(self, instance, owner):
return instance._value
def __set__(self, instance, value):
instance._value = value
class Bar(object):
foo = DescriptorA()
def __init__(self, foo):
self.foo = foo
class Bat(object):
foo = DescriptorB()
def __init__(self, foo):
self.foo = foo
print('BAR')
a = Bar(1)
print('a', a.foo)
b = Bar(2)
print('b', b.foo)
print('Checking a')
print('a', a.foo)
print('BAT')
c = Bat(3)
print('c', c.foo)
d = Bat(4)
print('d', d.foo)
print('Checking c')
print('c', c.foo)
输出
BAR
a 1
b 2
Checking a
a 2
BAT
c 3
d 4
Checking c
c 3
更新
只是想补充一下。为了回应好的答案。当不使用描述符,但仍然使用 class 属性时。我们得到不同的行为。这就是为什么我犯了使用 DescriptorA
的错误。
class Bar(object):
foo = None
def __init__(self, foo):
self.foo = foo
class Bat(object):
foo = None
def __init__(self, foo):
self.foo = foo
print('BAR')
a = Bar(1)
print('a', a.foo)
b = Bar(2)
print('b', b.foo)
print('Checking a')
print('a', a.foo)
print('BAT')
c = Bat(3)
print('c', c.foo)
d = Bat(4)
print('d', d.foo)
print('Checking c')
print('c', c.foo)
BAR
a 1
b 2
Checking a
a 1
BAT
c 3
d 4
Checking c
c 3
一个描述符在 class 级别定义,并且在 class 中只有该描述符的一个实例。因此,在第一个描述符中,即 DescriptorA
,您将值作为变量存储在描述符上,而不是 instance
对象上。显然,当您实例化另一个实例时,该值将被覆盖。
您在描述符中存储的任何值对于分配给描述符的 class 的所有实例都将保持不变。这就是 DescriptorB
起作用的原因,并且是使用描述符而不是第一个描述符的正确方法,除非您的用例需要变量,这些变量应该在各个实例中保持不变。
描述符是 class 属性(它们必须是描述符协议才能工作)。作为 class 属性意味着 class 的所有实例共享一个描述符实例(并且它是子 classes),所以你观察到 class Bar
和 DescriptorA
是预期的行为。
这并不意味着 "two instances of a class can't use the same descriptor (instance)" - 他们确实这样做了,这就是为什么你有这种行为 - 但你不能在你的描述符实例上存储每个实例的值,至少不是那么简单。
一个可能的解决方案是在您的描述符中维护一个 id(instance):instance_value
映射,即:
class DescriptorA(object):
def __init__(self, default=None):
self._values = {}
self._default = default
def __get__(self, instance, cls):
if instance is None:
return self
return self._values.get(id(instance), self._default)
def __set__(self, instance, value):
self._values[id(instance)] = value
但这有很多缺点,第一个明显的缺点是当实例被垃圾收集时,您的 _values
dict 不会被清除。它可能最终会在一个漫长的 运行 过程中吃掉相当多的 ram...
编辑:更新中的代码是 而不是 使用 class 属性。具有同名 class 属性在这里无关紧要 - 初始化程序设置了一个 value
instance 属性,它隐藏了 class 级别的属性(实际上从来没有在您的代码片段中使用)。
如果你想要一个具有 class 属性的有意义的例子,使用一个可变对象并改变它而不是创建一个实例属性:
>>> class Foo(object):
... bar = []
... def __init__(self, baaz):
... self.baaz = baaz
... self.bar.append(baaz)
...
>>> f1 = Foo("foo1")
>>> f1.baaz
'foo1'
>>> f1.bar
['foo1']
>>> f2 = Foo("foo2")
>>> f1.baaz
'foo1'
>>> f2.baaz
'foo2'
>>> f1.bar
['foo1', 'foo2']
>>> f2.bar
['foo1', 'foo2']
>>>
这实际上取决于您的用例如何存储变量。
我们有 4 个对象,每个对象都有自己的一组变量:
- 描述符class
- 描述符的实例
- 正常class
- 正常实例class
通常描述符 实例 存储在 "normal class" 中,因为在实例中存储描述符时不会调用描述符协议。您还可以 "go meta" 并在 metaclasses 上使用描述符或在描述符中使用描述符,但为了保持简短和理智,让我们忽略这些(这并不难,但可能有点太宽泛了)。
因此,如果您 DescriptorA
您存储:
value = None
描述符 classvalue = ?
在描述符实例中(至少在调用__set__
之后至少一次foo = descriptor instance
正常 class- class 实例中没有任何内容
在 DescriptorB
的情况下,您存储:
_value = None
描述符 class- 描述符实例中没有任何内容
foo = descriptor instance
正常 class_value = ?
在你正常的实例中 class
看出区别了吗?在第一种情况下,正常 class 的不同实例访问相同的描述符实例,因此所有内容都是共享的。在第二种情况下,您将所有内容都存储在 class 的实例中,而在描述符实例中没有任何内容,因此不会共享任何内容。
请注意,您的 DescriptorB
看起来很奇怪,为什么在您从不使用它的情况下将 _value = None
存储在描述符 class 中?请记住,您访问的是普通 class 实例的 _value
,而不是 __get__
!
_value
正如我之前所说,选择哪种方法取决于您的用例。通常您希望拥有一些共享属性和一些实例属性。但是您也可以在描述符的所有实例之间共享属性,并且假设您还可以在 __get__
中访问普通 class 实例的类型并在 __set__
中使用 type(instance)
你还可以修改 class 普通 class.
例如 Python 文档中的示例:
class RevealAccess(object):
"""A data descriptor that sets and returns values
normally and prints a message logging their access.
"""
def __init__(self, initval=None, name='var'):
self.val = initval
self.name = name
def __get__(self, obj, objtype):
print('Retrieving', self.name)
return self.val
def __set__(self, obj, val):
print('Updating', self.name)
self.val = val
>>> class MyClass(object):
... x = RevealAccess(10, 'var "x"')
... y = 5
...
他们故意为 class 变量 创建了一个描述符。在那种情况下,就没有 "instance" 并且它是否被共享并不重要,因为默认情况下 class 变量将由实例共享。这意味着即使您在一个实例上设置变量,它也会为所有其他实例发生变化。
因此,如果您不想共享描述符实例变量,则不应真正使用它。但是,您应该将它们用于应该共享的所有内容(例如属性的 name 等)。
可能也很有趣的是 "way" Python 查找属性。我通常会发现这张来自 this blog 的图片非常有用: