当 sys.path 不同时,dill python 模块是否处理导入模块?

Does the dill python module handle importing modules when sys.path differs?

我正在评估 dill,我想知道这种情况是否得到处理。我有一个案例,我在 python 进程中成功导入了一个模块。我可以使用 dill 序列化然后在具有不同 sys.path 且不包含该模块的不同进程中加载​​该模块吗?现在我遇到导入失败,但也许我做错了什么。

举个例子。我 运行 这个脚本 foo.py 模块的路径在我的 sys.path:

% cat dill_dump.py 
import dill
import foo
myFile = "./foo.pkl"
fh = open(myFile, 'wb')
dill.dump(foo, fh)

现在,我 运行 这个脚本在我的 PYTHONPATH 中没有 foo.py 的目录:

% cat dill_load.py 
import dill
myFile = "./foo.pkl"
fh = open(myFile, 'rb')
foo = dill.load(fh)
print foo

此堆栈跟踪失败:

Traceback (most recent call last):
  File "dill_load.py", line 4, in <module>
    foo = dill.load(fh)
  File "/home/b/lib/python/dill-0.2.4-py2.6.egg/dill/dill.py", line 199, in load
    obj = pik.load()
  File "/rel/lang/python/2.6.4-8/lib/python2.6/pickle.py", line 858, in load
    dispatch[key](self)
  File "/rel/lang/python/2.6.4-8/lib/python2.6/pickle.py", line 1133, in load_reduce
    value = func(*args)
  File "/home/b/lib/python/dill-0.2.4-py2.6.egg/dill/dill.py", line 678, in _import_module
    return __import__(import_name)
ImportError: No module named foo

所以,如果我需要在两个进程之间有相同的 python 路径,那么序列化 python 模块有什么意义呢?或者换句话说,通过 dill 加载 foo 是否比仅进行 "import foo" 调用有任何优势?

这是一个有趣的失败。请注意,如果您执行 dill.dumps(foo),您将获得模块 foo 的内容……失败的部分是使用 python 的内置导入挂钩(__import__)来只需将模块注册到 sys.modules。应该可以解决这个问题并修改 dill 以便在 PYTHONPATH 中找不到该模块时可以导入该模块。但是,我确实认为必须在 PYTHONPATH 中找到该模块是正确的……这是对模块的期望……所以我不确定这是否是个好主意。但它可能是...

如上所述,对于文件 foo.py,其内容为:hello = "hello world, I am foo"

>>> import dill
>>> import foo
>>> dill.dumps(foo)
'\x80\x02cdill.dill\n_import_module\nq\x00U\x03fooq\x01\x85q\x02Rq\x03}q\x04(U\x08__name__q\x05h\x01U\x08__file__q\x06U\x06foo.pyq\x07U\x05helloq\x08U\x15hello world, I am fooq\tU\x07__doc__q\nNU\x0b__package__q\x0bNub.'

你可以看到文件的内容被保存在 pickle 中。

对模块使用 dill 的主要原因是 dill 可以记录对模块的动态修改。例如添加函数或其他对象:

>>> import foo 
>>> import dill
>>> foo.a = 100
>>> with open('foo.pkl', 'w') as f:
...   dill.dump(foo, f)
... 
>>> 

然后重新启动...(在 PYTHONPATH 中使用 foo

Python 2.7.10 (default, May 25 2015, 13:16:30) 
[GCC 4.2.1 Compatible Apple LLVM 5.1 (clang-503.0.40)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import dill
>>> with open('foo.pkl', 'r') as f:
...   foo = dill.load(f)
... 
>>> foo.hello
'hello world, I am foo'
>>> foo.a
100
>>> 

我已将其添加为错误报告/功能请求:https://github.com/uqfoundation/dill/issues/123