莳萝 vs cPickle 速度差异
dill vs cPickle speed difference
我正在尝试序列化数千个对象,其中一些对象是 lambda 对象。
由于 cPickle
不适用于 lambda,我尝试使用 dill
。然而,在 unpickleing(或 undilling(?))时,计算速度下降了 10 倍以上。查看源代码,似乎 dill
在内部使用 pickle
这可能是速度下降的原因。
我还有其他选择可以结合两个模块的优点吗?
编辑:最显着的速度下降是在脱酸过程中。
我是 dill
的作者。是的,dill
通常较慢,但这是您为更强大的序列化付出的代价。如果您要序列化很多 类 和函数,那么您可能想尝试 dill.settings
中的 dill
变体之一 如果您使用 byref=True
那么 dill
将通过引用腌制几个对象(比默认更快)。其他设置在选定对象中权衡可拾取性与速度。
In [1]: import dill
In [2]: f = lambda x:x
In [3]: %timeit dill.loads(dill.dumps(f))
1000 loops, best of 3: 286 us per loop
In [4]: dill.settings['byref'] = True
In [5]: %timeit dill.loads(dill.dumps(f))
1000 loops, best of 3: 237 us per loop
In [6]: dill.settings
Out[6]: {'byref': True, 'fmode': 0, 'protocol': 2, 'recurse': False}
In [7]: dill.settings['recurse'] = True
In [8]: %timeit dill.loads(dill.dumps(f))
1000 loops, best of 3: 408 us per loop
In [9]: class Foo(object):
...: x = 1
...: def bar(self, y):
...: return y + self.x
...:
In [10]: g = Foo()
In [11]: %timeit dill.loads(dill.dumps(g))
10000 loops, best of 3: 87.6 us per loop
In [12]: dill.settings['recurse'] = False
In [13]: %timeit dill.loads(dill.dumps(g))
10000 loops, best of 3: 87.4 us per loop
In [14]: dill.settings['byref'] = False
In [15]: %timeit dill.loads(dill.dumps(g))
1000 loops, best of 3: 499 us per loop
In [16]:
我正在尝试序列化数千个对象,其中一些对象是 lambda 对象。
由于 cPickle
不适用于 lambda,我尝试使用 dill
。然而,在 unpickleing(或 undilling(?))时,计算速度下降了 10 倍以上。查看源代码,似乎 dill
在内部使用 pickle
这可能是速度下降的原因。
我还有其他选择可以结合两个模块的优点吗?
编辑:最显着的速度下降是在脱酸过程中。
我是 dill
的作者。是的,dill
通常较慢,但这是您为更强大的序列化付出的代价。如果您要序列化很多 类 和函数,那么您可能想尝试 dill.settings
中的 dill
变体之一 如果您使用 byref=True
那么 dill
将通过引用腌制几个对象(比默认更快)。其他设置在选定对象中权衡可拾取性与速度。
In [1]: import dill
In [2]: f = lambda x:x
In [3]: %timeit dill.loads(dill.dumps(f))
1000 loops, best of 3: 286 us per loop
In [4]: dill.settings['byref'] = True
In [5]: %timeit dill.loads(dill.dumps(f))
1000 loops, best of 3: 237 us per loop
In [6]: dill.settings
Out[6]: {'byref': True, 'fmode': 0, 'protocol': 2, 'recurse': False}
In [7]: dill.settings['recurse'] = True
In [8]: %timeit dill.loads(dill.dumps(f))
1000 loops, best of 3: 408 us per loop
In [9]: class Foo(object):
...: x = 1
...: def bar(self, y):
...: return y + self.x
...:
In [10]: g = Foo()
In [11]: %timeit dill.loads(dill.dumps(g))
10000 loops, best of 3: 87.6 us per loop
In [12]: dill.settings['recurse'] = False
In [13]: %timeit dill.loads(dill.dumps(g))
10000 loops, best of 3: 87.4 us per loop
In [14]: dill.settings['byref'] = False
In [15]: %timeit dill.loads(dill.dumps(g))
1000 loops, best of 3: 499 us per loop
In [16]: