如何使用给定特定前缀的向量打印出 Trie 中的单词
How to Print Out the Words In a Trie With a Vector Given a Particular Prefix
我目前正在做一个项目,我需要在 trie 中打印出与给定前缀匹配的单词,该前缀由用户给出,使用字符串向量打印出这些单词。但是,我很难开始使用它,希望你们能给我任何建议。
这就是我的意思的例子
trie 中的单词 { app, address, add, beg, cow, mice}
给定广告前缀
使用向量打印出包含前缀 ad 的单词:
地址
添加
非常感谢您提供的任何帮助。
这在很大程度上取决于 trie 的实现,尽管我在下面提供了一个示例 trie。
每个 trie 包含三件事:
- 一堆树枝
- 一个根(可能为空)
- 一个布尔值,表示这个 trie 是否代表一个完整的单词
基于此,我们可以做一些事情,比如向 trie 中添加单词,检查单词是否在 trie 中,以及对 trie 中的所有单词应用一个函数。我提供了成员函数来完成这些事情。
#include <memory>
#include <iterator>
struct WordTrie {
static int index_from_char(char c) {
return (unsigned char)c;
}
static int char_from_index(int index) {
return (char)(unsigned char)index;
}
std::unique_ptr<WordTrie[]> branches;
WordTrie* root;
bool is_complete_word = false;
// Make an empty Trie
WordTrie() : branches(nullptr), root(nullptr) {}
// Make a WordTrie with the given root
WordTrie(WordTrie* root) : branches(nullptr), root(root) {}
int get_index_in_root() const {
WordTrie const* branch_zero = root->branches.get();
return std::distance(branch_zero, this);
}
void append_char(std::string& s) {
if(root != nullptr) {
s += char_from_index(get_index_in_root());
}
}
void add_word(char const* str, int length) {
if(length > 0) {
char c = *str;
if(branches == nullptr) {
branches.reset(new WordTrie[256]);
for(int i = 0; i < 256; i++) {
branches[i].root = this;
}
}
branches[index_from_char(c)].add_word(str + 1, length - 1);
} else {
is_complete_word = true;
}
}
bool has_word(char const* str, int length) {
if(length == 0) {
return is_complete_word;
}
return branches[index_from_char(*str)].has_word(str + 1, length - 1);
}
bool has_word(std::string const& s) {
return has_word(s.data(), s.size());
}
template<class F>
void apply_over_words_in_trie(std::string const& word, F&& func) {
if(is_complete_word) {
func(word);
}
// Exit if there are no branches
if(branches == nullptr) return;
//Add character to 'word'
std::string new_word = word + '_';
for(int i = 0; i < 256; i++) {
new_word.back() = char_from_index(i);
branches[i].apply_over_words_in_trie(new_word, func);
}
}
};
首先,特里树是一棵树。
在 trie 中,所有具有给定前缀(比如 ad
)的单词实际上都存储在搜索前缀 ad
.[=25= 时访问的 trie 子树中]
因此,要打印 trie 中具有给定前缀的所有单词,分两步完成:
- 找到你的前缀对应的节点
node
- 列出以
node
为根的子树中的所有单词。
这是一个伪代码:
find_all_words_starting_with(string prefix, trieNode node, int depth){
if (depth == length(prefix)){
suffix = empty_string
print_all_words_with_prefix(prefix, suffix, node)
} else {
letter = prefix[depth]
if (node.hasChild(letter)){
find_all_words_starting_with(prefix, node.getChild(letter), depth+1)
} else { // no word with the correct prefix
return
}
}
}
print_all_words_with_prefix(prefix, suffix, node){
if (node.isCompleteWord){
print(prefix + suffix)
}
for each letter c in the alphabet {
if (node.hasChild(c)){
print_all_words_with_prefix(prefix, suffix + c, node.getChild(c))
}
}
}
find_all_words_starting_with
完成了工作的第一部分。它找到与前缀对应的节点,并调用第二个函数,print_all_words_with_prefix
,将打印子树中所有完整的单词。
我目前正在做一个项目,我需要在 trie 中打印出与给定前缀匹配的单词,该前缀由用户给出,使用字符串向量打印出这些单词。但是,我很难开始使用它,希望你们能给我任何建议。
这就是我的意思的例子
trie 中的单词 { app, address, add, beg, cow, mice} 给定广告前缀 使用向量打印出包含前缀 ad 的单词: 地址 添加
非常感谢您提供的任何帮助。
这在很大程度上取决于 trie 的实现,尽管我在下面提供了一个示例 trie。
每个 trie 包含三件事:
- 一堆树枝
- 一个根(可能为空)
- 一个布尔值,表示这个 trie 是否代表一个完整的单词
基于此,我们可以做一些事情,比如向 trie 中添加单词,检查单词是否在 trie 中,以及对 trie 中的所有单词应用一个函数。我提供了成员函数来完成这些事情。
#include <memory>
#include <iterator>
struct WordTrie {
static int index_from_char(char c) {
return (unsigned char)c;
}
static int char_from_index(int index) {
return (char)(unsigned char)index;
}
std::unique_ptr<WordTrie[]> branches;
WordTrie* root;
bool is_complete_word = false;
// Make an empty Trie
WordTrie() : branches(nullptr), root(nullptr) {}
// Make a WordTrie with the given root
WordTrie(WordTrie* root) : branches(nullptr), root(root) {}
int get_index_in_root() const {
WordTrie const* branch_zero = root->branches.get();
return std::distance(branch_zero, this);
}
void append_char(std::string& s) {
if(root != nullptr) {
s += char_from_index(get_index_in_root());
}
}
void add_word(char const* str, int length) {
if(length > 0) {
char c = *str;
if(branches == nullptr) {
branches.reset(new WordTrie[256]);
for(int i = 0; i < 256; i++) {
branches[i].root = this;
}
}
branches[index_from_char(c)].add_word(str + 1, length - 1);
} else {
is_complete_word = true;
}
}
bool has_word(char const* str, int length) {
if(length == 0) {
return is_complete_word;
}
return branches[index_from_char(*str)].has_word(str + 1, length - 1);
}
bool has_word(std::string const& s) {
return has_word(s.data(), s.size());
}
template<class F>
void apply_over_words_in_trie(std::string const& word, F&& func) {
if(is_complete_word) {
func(word);
}
// Exit if there are no branches
if(branches == nullptr) return;
//Add character to 'word'
std::string new_word = word + '_';
for(int i = 0; i < 256; i++) {
new_word.back() = char_from_index(i);
branches[i].apply_over_words_in_trie(new_word, func);
}
}
};
首先,特里树是一棵树。
在 trie 中,所有具有给定前缀(比如 ad
)的单词实际上都存储在搜索前缀 ad
.[=25= 时访问的 trie 子树中]
因此,要打印 trie 中具有给定前缀的所有单词,分两步完成:
- 找到你的前缀对应的节点
node
- 列出以
node
为根的子树中的所有单词。
这是一个伪代码:
find_all_words_starting_with(string prefix, trieNode node, int depth){
if (depth == length(prefix)){
suffix = empty_string
print_all_words_with_prefix(prefix, suffix, node)
} else {
letter = prefix[depth]
if (node.hasChild(letter)){
find_all_words_starting_with(prefix, node.getChild(letter), depth+1)
} else { // no word with the correct prefix
return
}
}
}
print_all_words_with_prefix(prefix, suffix, node){
if (node.isCompleteWord){
print(prefix + suffix)
}
for each letter c in the alphabet {
if (node.hasChild(c)){
print_all_words_with_prefix(prefix, suffix + c, node.getChild(c))
}
}
}
find_all_words_starting_with
完成了工作的第一部分。它找到与前缀对应的节点,并调用第二个函数,print_all_words_with_prefix
,将打印子树中所有完整的单词。