如何比较字符串(不区分大小写),同时将相同的字符串插入二叉树(区分大小写)?

How do I compare strings (insensitive case), while inserting same strings into a binary Tree (sensitive case)?

本质上,对于如何将字符串与我的 insert 函数进行比较,我是一堵砖墙,在插入具有原始大小写的相同字符串时不考虑大小写。

这是我的 insert 函数。

TreeNode* Tree::insert(TreeNode* node, string value) {
    transform(value.begin(), value.end(), value.begin(), ::tolower);

    if (node == nullptr) {
        return newTreeNode(value);
    }
    if (node->data < value) {
        node->left = insert(node->left, value);
    }
    else if(node-> data > value) {
        node->right = insert(node->right, value);
    }
    else {
        return node;
    }
    node->height = 1 + max(height(node->left), height(node->right));
    return node;
}

这是我的树头文件:

struct TreeNode {
public:
    TreeNode* left;
    TreeNode* right;
    string data;
};

class Tree {
public:
    TreeNode * newTreeNode(string data);
    TreeNode * insert(TreeNode* node, string value);
    void lexographicPrint(TreeNode* root);
};

newTreeNode 函数:

TreeNode* AvlTree::newTreeNode(string value) {
    TreeNode* treeNode = new TreeNode();
    treeNode->data = value;
    treeNode->left = nullptr;
    treeNode->right= nullptr;
    treeNode->height = 1;
    return treeNode;
}

打印函数:

void AvlTree::lexographicPrint(TreeNode* root) {
    if (root != nullptr) {
        lexographicPrint(root->right);
        cout << root->data << " ";
        lexographicPrint(root->left);
    }
}

除了树包含所有小写值外,这目前可以正常工作,这显然是由于 transform 函数。我试过使用 holdValue,像这样:

string holdValue;
if (isupper(value[0]) {
    holdValue = value;
}

在我的函数顶部,将所有 insert 调用替换为 holdValue。当仍然与 value 进行比较时,我很困惑为什么这会改变我的树的顺序。我希望这能奏效,但事实并非如此。我还没有通过 Google 搜索找到解决方案。

本质上,您想要存储大小写混合的值,但按小写形式排序。

您可以做两件事。

  1. case_insensitive_compare(a, b) < 0case_insensitive_compare(a, b) > 0 替换所有 a < ba > b 检查,其中 case_insensitive_compare 看起来像:

    // +ve => l > r
    // 0 => l equivalent to r (possibly different case)
    // -ve => l < r
    int case_insensitive_compare(const std::string& l, const std::string& r) noexcept {
        std::size_t max_size = std::max(l.size(), r.size());
        for (std::size_t i = 0; i < max_size; ++i) {
            int cmp = std::tolower(l[i]) - std::tolower(r[i]);
            if (cmp != 0) return cmp;
        }
        return l.size() - r.size();
    }
    
    // Or in c++20
    // std::weak_ordering::greater => l > r
    // std::weak_ordering::equivalent => l equivalent to r
    // std::weak_ordering::less => l < r
    std::weak_ordering case_insensitive_compare(const std::string& l, const std::string& r) noexcept {
        std::size_t max_size = std::max(l.size(), r.size());
        for (std::size_t i = 0; i < max_size; ++i) {
            auto cmp = std::tolower(l[i]) <=> std::tolower(r[i]);
            if (cmp != 0) return cmp;
        }
        return l.size() <=> r.size();
    }
    

    您应该能够将其推广到任何比较器函数(对于 Tree<T>、比较器 cmp(const T&, const T&) -> int

  2. 让你的 TreeNode 存储一个 key/value 对,其中键是小写字符串,值是混合大小写字符串。如果您需要让树存储另一个值,请将值设为 std::tuple<std::string, ValueType>.

您可以使用不区分大小写的比较,而不是使用 std::string<

bool ci_less(const std::string & lhs, const std::string & rhs) {
    return std::lexicographical_compare(lhs.begin(), lhs.end(), rhs.begin(), rhs.end(), [](char l, char r){ return std::to_lower(l) < std::tolower(r); });
}

TreeNode* Tree::insert(TreeNode* node, std::string value) {

    if (node == nullptr) {
        return newTreeNode(std::move(value));
    }
    if (ci_less(node->data, value)) {
        node->left = insert(node->left, std::move(value));
    }
    else if(ci_less(value, node->data)) {
        node->right = insert(node->right, std::move(value));
    }
    else {
        return node;
    }
    node->height = 1 + max(height(node->left), height(node->right));
    return node;
}

您将需要 #include <algorithm> std::lexicographical_compare

以类似的方式,您可以改为定义 case insensitive string type

struct ci_char_traits : public std::char_traits<char> {
    static char to_upper(char ch) {
        return std::toupper((unsigned char) ch);
    }
    static bool eq(char c1, char c2) {
         return to_upper(c1) == to_upper(c2);
     }
    static bool lt(char c1, char c2) {
         return to_upper(c1) <  to_upper(c2);
    }
    static int compare(const char* s1, const char* s2, size_t n) {
        while ( n-- != 0 ) {
            if ( to_upper(*s1) < to_upper(*s2) ) return -1;
            if ( to_upper(*s1) > to_upper(*s2) ) return 1;
            ++s1; ++s2;
        }
        return 0;
    }
    static const char* find(const char* s, int n, char a) {
        auto const ua (to_upper(a));
        while ( n-- != 0 ) 
        {
            if (to_upper(*s) == ua)
                return s;
            s++;
        }
        return nullptr;
    }
};

using ci_string = std::basic_string<char, ci_char_traits>;