将元素添加到 Marisa Trie
Adding an element into a Marisa Trie
在拼写错误检测任务中,我使用 marisa_tries 数据结构作为我的词典 Python 3.5。
小问题
如何在 marisa_trie
中添加一个元素?
上下文
这个想法是:如果一个词在我的词典中,那么它就是正确的。现在,如果它不在我的词典中,它可能是不正确的。但是我计算了整个文档中的词频,如果词频足够高,我想保存这个词,考虑到它足够频繁,所以可能是正确的。
在那种情况下,如何将这个新词添加到我的 marisa_trie.Trie
词典中? (无需每次都构建一个新的 trie)?
谢谢:)
marisa_trie.Trie
实现了一个不可变的trie,所以你的问题的答案是:不可能。
您可能想尝试一个名为 datrie
的类似 Python 包,它支持修改和相对快速的查询(PyPI 页面列出了一些针对内置 dict
的基准)。
在拼写错误检测任务中,我使用 marisa_tries 数据结构作为我的词典 Python 3.5。
小问题
如何在 marisa_trie
中添加一个元素?
上下文
这个想法是:如果一个词在我的词典中,那么它就是正确的。现在,如果它不在我的词典中,它可能是不正确的。但是我计算了整个文档中的词频,如果词频足够高,我想保存这个词,考虑到它足够频繁,所以可能是正确的。
在那种情况下,如何将这个新词添加到我的 marisa_trie.Trie
词典中? (无需每次都构建一个新的 trie)?
谢谢:)
marisa_trie.Trie
实现了一个不可变的trie,所以你的问题的答案是:不可能。
您可能想尝试一个名为 datrie
的类似 Python 包,它支持修改和相对快速的查询(PyPI 页面列出了一些针对内置 dict
的基准)。