Web 应用程序的高效 trie 存储

Efficient trie storage for a web app

我有一个 Aho Corasick 特里树,我通过它来解析一段文本。现在这个 trie 作为我的烧瓶应用程序的一部分存在。它部署在 Heroku 上,目前我天真地存储了自动机的腌制形式,在需要时解开它并使用它。什么是有效存储 Aho Corasick 自动机的更好方法?

访问磁盘上的 trie 并不完全是微不足道的,因此将其加载到内存中是一个很好的方法。

试试 pyahocorasick 库 FWIW。 http://pyahocorasick.readthedocs.io/ 是你的朋友。它可以很好地腌制自动机并使用紧凑的内存方案来限制内存使用