在 python 2.7 中创建新的不同 class 实例时出现问题

Problem creating new distinct class instance in python 2.7

我有一个class,它本质上应该能够初始化自身并根据一行文本(字符串)设置内部值。 这在创建单个实例时似乎工作正常,但是,在创建第二个实例时,输入第一个实例的文本行显然被输入到第二个实例的一个内部变量中! class 的 init 构造函数定义了所有相关参数的默认值,这些参数传递给相应的内部变量。具体来说, 'prefixComments' 参数的默认值为 [] 这意味着 'self.PrefixComments' 应该设置为相同的东西(一个空列表)......不幸的是,它显然被设置为行用于创建前一个对象的文本(或者,至少,这是我最好的猜测)。

我真的对这里发生的事情感到困惑。关于如何修复它的任何想法。代码和输出如下:

代码:

import collections
from collections import OrderedDict
import numpy as np
import string
import re
import gc

class AtomEntry:
    def __init__(self,atomName="",atomType="",charge=0.0,
                 comment="",prefixComments=[],
                 verbose=False):
        self.Name=atomName
        self.Type=atomType
        self.Charge=charge
        self.Comment=comment
        self.PrefixComments=prefixComments

    def from_line_string(self,line):
        #returns 1 if an error is encountered, 0 if successful
        lineTokens=line.split()
        if len(lineTokens)<4:
            print("Error: too few entries to construct ATOM record")
            return(1)
        elif lineTokens[0] != "ATOM":
            print("ERROR: atom entries must begin with the keyword 'ATOM'")
            return(1)
        else:
            self.Name=lineTokens[1]
            self.Type=lineTokens[2]
            self.Charge=float(lineTokens[3])
            if len(lineTokens) >=5:
                self.Comment=string.replace(
                    s=' '.join(lineTokens[5:len(lineTokens)]),
                    old='!',new='')
        return(0)

    def to_str(self,nameOnly=False):
        if nameOnly:
            return "%s"%(self.Name)
        else: 
            return repr(self)

    def __repr__(self):
        outStrs=self.PrefixComments
        outStrs.append(
            "ATOM %6s %6s %6.3f !%s"%(
                self.Name,self.Type,self.Charge,self.Comment))
        return ''.join(outStrs)

tempAtom1=AtomEntry()
tempAtom1.from_line_string("ATOM S1     SG2R50 -0.067 !   93.531")
print tempAtom1
print ""
gc.collect()
tempAtom2=AtomEntry()
tempAtom2.from_line_string("ATOM C1     CG2R53  0.443 !   83.436")
print tempAtom2
print""

print tempAtom2.Name
print tempAtom2.Type
print tempAtom2.Charge
print tempAtom2.Comment
print tempAtom2.PrefixComments

gc.collect()

输出:

ATOM     S1 SG2R50 -0.067 !93.531

ATOM     S1 SG2R50 -0.067 !93.531ATOM     C1 CG2R53  0.443 !83.436

C1
CG2R53
0.443
83.436
['ATOM     S1 SG2R50 -0.067 !93.531', 'ATOM     C1 CG2R53  0.443 !83.436']

您有两个问题,都与重用 list 相关。第一,您为 prefixComments/self.PrefixComments 使用了可变默认参数。 Don't do that。将初始值设定项更改为:

def __init__(self,atomName="",atomType="",charge=0.0,
             comment="",prefixComments=(),
             verbose=False):
    self.Name=atomName
    self.Type=atomType
    self.Charge=charge
    self.Comment=comment
    self.PrefixComments = list(prefixComments)

首先避免接收可变参数,并将其显式浅复制到新的 list 以便调用者的参数与属性断开链接。

其次,你的__repr__正在修改这个属性,所以__repr__不是幂等的;每次调用它时,它都会不断累积。也解决这个问题:

def __repr__(self):
    outStrs=self.PrefixComments[:]  # Shallow copy the l
    outStrs.append(
        "ATOM %6s %6s %6.3f !%s"%(
            self.Name,self.Type,self.Charge,self.Comment))
    return ''.join(outStrs)

旁注:from_line_string 确实应该是一个替代构造函数,因此您可以直接使用它从字符串创建一个新实例,而不是创建一个空白对象,只是在下一行重新初始化它.这很容易解决;只需将其更改为解析的 classmethod,然后调用常规构造函数(并在错误时引发异常,而不是使用容易遗漏错误的 C 样式 return 代码):

# Makes sure this works either on the class or an instance of the class
# as a constructor of a brand new instance
@classmethod
def from_line_string(cls, line):
    # Returns a new instance, or raises an exception if an error is encountered
    lineTokens = line.split()
    if len(lineTokens) < 4:
        raise ValueError("too few entries to construct ATOM record")
    elif lineTokens[0] != "ATOM":
        raise ValueError("atom entries must begin with the keyword 'ATOM'")

    name=lineTokens[1]
    type=lineTokens[2]
    charge=float(lineTokens[3])
    # This works fine, producing an empty string, even if lineTokens is
    # doesn't have an index 5 or higher; comment will be the empty string
    comment = ' '.join(lineTokens[5:]).replace('!', '')
    return cls(name, type, charge, comment)

这将简化您的使用:

tempAtom1=AtomEntry()
tempAtom1.from_line_string("ATOM S1     SG2R50 -0.067 !   93.531")

至:

tempAtom1 = AtomEntry.from_line_string("ATOM S1     SG2R50 -0.067 !   93.531")

您可能还想使 __init__ 的大部分参数成为必需的(没有默认值,除了 commentprefixComment),因为其他三个属性是必需的,并且您不再需要创建空实例来使用 from_line_string.

重新初始化它们