如何使用给定特定前缀的向量打印出 Trie 中的单词

How to Print Out the Words In a Trie With a Vector Given a Particular Prefix

我目前正在做一个项目,我需要在 trie 中打印出与给定前缀匹配的单词,该前缀由用户给出,使用字符串向量打印出这些单词。但是,我很难开始使用它,希望你们能给我任何建议。

这就是我的意思的例子

trie 中的单词 { app, address, add, beg, cow, mice} 给定广告前缀 使用向量打印出包含前缀 ad 的单词: 地址 添加

非常感谢您提供的任何帮助。

这在很大程度上取决于 trie 的实现,尽管我在下面提供了一个示例 trie。

每个 trie 包含三件事:

  • 一堆树枝
  • 一个根(可能为空)
  • 一个布尔值,表示这个 trie 是否代表一个完整的单词

基于此,我们可以做一些事情,比如向 trie 中添加单词,检查单词是否在 trie 中,以及对 trie 中的所有单词应用一个函数。我提供了成员函数来完成这些事情。

#include <memory>
#include <iterator>

struct WordTrie {
    static int index_from_char(char c) {
        return (unsigned char)c; 
    }
    static int char_from_index(int index) {
        return (char)(unsigned char)index; 
    }
    std::unique_ptr<WordTrie[]> branches; 
    WordTrie* root; 
    bool is_complete_word = false; 
    // Make an empty Trie
    WordTrie() : branches(nullptr), root(nullptr) {}
    // Make a WordTrie with the given root
    WordTrie(WordTrie* root) : branches(nullptr), root(root) {}


    int get_index_in_root() const {
        WordTrie const* branch_zero = root->branches.get();
        return std::distance(branch_zero, this); 
    }
    void append_char(std::string& s) {
        if(root != nullptr) {
            s += char_from_index(get_index_in_root()); 
        }
    }
    void add_word(char const* str, int length) {
        if(length > 0) {
            char c = *str; 
            if(branches == nullptr) {
                branches.reset(new WordTrie[256]); 
                for(int i = 0; i < 256; i++) {
                    branches[i].root = this; 
                }
            }
            branches[index_from_char(c)].add_word(str + 1, length - 1); 
        } else {
            is_complete_word = true; 
        }
    }
    bool has_word(char const* str, int length) {
        if(length == 0) {
            return is_complete_word; 
        }
        return branches[index_from_char(*str)].has_word(str + 1, length - 1); 
    }
    bool has_word(std::string const& s) {
        return has_word(s.data(), s.size()); 
    }
    template<class F>
    void apply_over_words_in_trie(std::string const& word, F&& func) {
        if(is_complete_word) {
            func(word); 
        }

        // Exit if there are no branches
        if(branches == nullptr) return; 
        //Add character to 'word'
        std::string new_word = word + '_';
        for(int i = 0; i < 256; i++) {
            new_word.back() = char_from_index(i); 
            branches[i].apply_over_words_in_trie(new_word, func); 
        }
    }
};

首先,特里树是一棵树。

在 trie 中,所有具有给定前缀(比如 ad)的单词实际上都存储在搜索前缀 ad.[=25= 时访问的 trie 子树中] 因此,要打印 trie 中具有给定前缀的所有单词,分两步完成:

  1. 找到你的前缀对应的节点node
  2. 列出以 node 为根的子树中的所有单词。

这是一个伪代码:

find_all_words_starting_with(string prefix, trieNode node, int depth){
    if (depth == length(prefix)){
        suffix = empty_string
        print_all_words_with_prefix(prefix, suffix, node)
    } else {
        letter = prefix[depth]
        if (node.hasChild(letter)){
            find_all_words_starting_with(prefix, node.getChild(letter), depth+1)
        } else { // no word with the correct prefix
            return
        }
    }
}

print_all_words_with_prefix(prefix, suffix, node){
    if (node.isCompleteWord){
        print(prefix + suffix)
    }
    for each letter c in the alphabet {
        if (node.hasChild(c)){
            print_all_words_with_prefix(prefix, suffix + c, node.getChild(c))
        }
    }
}

find_all_words_starting_with 完成了工作的第一部分。它找到与前缀对应的节点,并调用第二个函数,print_all_words_with_prefix,将打印子树中所有完整的单词。