删除已 Pickle 的变量

Delete a Variable that has been Pickled

在 Python 方面我不是很熟练,但我确实让自己陷入困境。撇开双关语不谈,我正在使用 Tkinter,我有一个特殊的功能可以让我轻松保存我所有的全局变量:

def start_save(globals_=None) :
    global quick_save_file, options
    if globals_ is None:
        globals_ = globals()
    the_file = tkFileDialog.asksaveasfilename(**file_opt) 
    my_shelf = shelve.open(the_file,'c') # 'n' for new
    for key, value in globals_.items():
        if not key.startswith('__'):
            try:
                my_shelf[key] = globals()[key]
                add_line( "Saved %r" % key)
            except TypeError:
                # __builtins__, my_shelf, and imported modules can not be shelved.
                add_line(('ERROR shelving: {0}'.format(key)))
            except :
                add_line( "Cannot pickle %r" % key)
    quick_save_file = the_file
    options['initialfile'] = quick_save_file
    my_shelf.close()

基本上,我们正在查看尝试后的结果:它将我所有的全局内容保存到用户选择的文件中。现在,我知道 Tkinter 小部件无法保存,但我不小心创建了一个小部件,并将其网格化在同一行上,如下所示:

ldrones_e = Label(frame_drones, text = "Number of drones:").grid(row = 3, column = 1, columnspan = 2)

这导致我的搁置函数将其读取为 None 而不是小部件!所以它没有说它不能用它做任何事情,而是将它保存为 None。现在,当我打开上述文件时,它会获取我的小部件变量并将其设置为 none。我无法保存它,将 .grid 放在单独的行上,因为那样它就不会被保存。我不能使用 del 来删除变量,因为它在不同的文件中。 (其实我应该可以,只是不知道怎么做)

所以我的问题是如何从我的 pickle 文件中删除那个讨厌的 ldrones_e 变量,这样我的程序将使用没有 have.grid 附加的新 ldrones_e 变量.

如果绝对必要,您可以手动删除 pickle 的相关部分。这可以使用 pickletools.dis 来实现……但是,您必须了解 pickle 工作的递归方式。 Pickles 是通过递归到一个对象中,并在对象本身被 pickle 之前 pickle 它的状态依赖关系来制作的……然后类似地递归地处理所有依赖关系……等等,直到那个特定的递归分支命中一个不需要依赖关系的对象泡菜。然后,一旦所有的依赖对象都被 pickle 了,你就大功告成了。

在这里你可以看到 pickletools.dis 显示泡菜的每一部分是什么:

>>> import pickletools
>>> import pickle   
>>> pik = pickle.dumps(dict(zip(list('abcde'),[1,2,3,4,5])))
>>> pickletools.dis(pik)
    0: (    MARK
    1: d        DICT       (MARK at 0)
    2: p    PUT        0
    5: S    STRING     'a'
   10: p    PUT        1
   13: I    INT        1
   16: s    SETITEM
   17: S    STRING     'c'
   22: p    PUT        2
   25: I    INT        3
   28: s    SETITEM
   29: S    STRING     'b'
   34: p    PUT        3
   37: I    INT        2
   40: s    SETITEM
   41: S    STRING     'e'
   46: p    PUT        4
   49: I    INT        5
   52: s    SETITEM
   53: S    STRING     'd'
   58: p    PUT        5
   61: I    INT        4
   64: s    SETITEM
   65: .    STOP
highest protocol among opcodes = 0
>>> pik
"(dp0\nS'a'\np1\nI1\nsS'c'\np2\nI3\nsS'b'\np3\nI2\nsS'e'\np4\nI5\nsS'd'\np5\nI4\ns."

这里是 dill,显示了物品腌制的路线。像 F1: … 这样的打印输出是 pickle 对象的开始,而 # F1 是 pickle 对象的结束:

>>> import dill
>>> dill.detect.trace(True)
>>> dill.dumps(dict(zip(list('abcde'),[1,2,3,4,5])))
D2: <dict object at 0x10c5c9e88>
# D2
'\x80\x02}q\x00(U\x01aq\x01K\x01U\x01cq\x02K\x03U\x01bq\x03K\x02U\x01eq\x04K\x05U\x01dq\x05K\x04u.'
>>> 
>>> def foo(x):
...   def bar(y):
...     return x+y
...   return bar
... 
>>> dill.dumps(foo)
F1: <function foo at 0x10c60a9b0>
F2: <function _create_function at 0x10c5a68c0>
# F2
Co: <code object foo at 0x10b6130b0, file "<stdin>", line 1>
F2: <function _unmarshal at 0x10c5a6758>
# F2
# Co
D1: <dict object at 0x10b51a168>
# D1
D2: <dict object at 0x10c5c4910>
# D2
# F1
'\x80\x02cdill.dill\n_create_function\nq\x00(cdill.dill\n_unmarshal\nq\x01U\xd6c\x01\x00\x00\x00\x02\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00s\x13\x00\x00\x00\x87\x00\x00f\x01\x00d\x01\x00\x86\x00\x00}\x01\x00|\x01\x00S(\x02\x00\x00\x00Nc\x01\x00\x00\x00\x01\x00\x00\x00\x02\x00\x00\x00\x13\x00\x00\x00s\x08\x00\x00\x00\x88\x00\x00|\x00\x00\x17S(\x01\x00\x00\x00N(\x00\x00\x00\x00(\x01\x00\x00\x00t\x01\x00\x00\x00y(\x01\x00\x00\x00t\x01\x00\x00\x00x(\x00\x00\x00\x00s\x07\x00\x00\x00<stdin>t\x03\x00\x00\x00bar\x02\x00\x00\x00s\x02\x00\x00\x00\x00\x01(\x00\x00\x00\x00(\x02\x00\x00\x00R\x01\x00\x00\x00R\x02\x00\x00\x00(\x00\x00\x00\x00(\x01\x00\x00\x00R\x01\x00\x00\x00s\x07\x00\x00\x00<stdin>t\x03\x00\x00\x00foo\x01\x00\x00\x00s\x04\x00\x00\x00\x00\x01\x0f\x02q\x02\x85q\x03Rq\x04c__builtin__\n__main__\nU\x03fooq\x05NN}q\x06tq\x07Rq\x08.'
>>> 
>>> dill.detect.trace(False)

但是,我最好的建议是,如果您打算从 pickle 中删除对象,然后以更明智的方式进行 pickle……假设您想要 pickle 一个对象字典(就像 globals() 中的所有内容)。通过使用 klepto,您可以将字典中的每个对象作为腌制对象保存到单个目录中的不同文件。

>>> import klepto
>>> d = klepto.archives.dir_archive('saveme', serialized=True, cached=False)
>>> d.update(globals())
>>> d.keys()
['pickletools', 'dill', 'pik', 'd', '__builtins__', 'klepto', '__package__', '__name__', 'foo', 'pickle', '__doc__']
>>> 

我们退出,并开始一个新的解释器会话:

Python 2.7.10 (default, May 25 2015, 13:16:30) 
[GCC 4.2.1 Compatible Apple LLVM 5.1 (clang-503.0.40)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import klepto
>>> d = klepto.archives.dir_archive('saveme', serialized=True, cached=False)
>>> d.keys()
['pickletools', 'dill', 'pik', 'd', '__builtins__', 'klepto', '__package__', '__name__', 'foo', 'pickle', '__doc__']
>>> for i,j in d.items():
...   globals()[i] = j       
... 
>>> foo(3)(4)
7
>>> 

每个对象都可以从它自己的文件中单独访问……因此您可以简单地 pop 其中之一。您还可以使用 cached=True,并将您喜欢的任何对象加载到内存中(未显示)——使用 cached=False,不会将任何对象加载到内存中,并且直接与文件后端交互。

>>> x = d.pop('d')
>>> del d['pik'], x
>>> d.keys()
['pickletools', 'dill', '__builtins__', 'klepto', '__package__', '__name__', 'foo', 'pickle', '__doc__']
>>> d['foo'](3)(4)
7