处理字母和数字组合的简单方法

Simple way to handle letter and number combination

假设我有两个字符串:

string_ex1 = 'AbC024'
string_ex2 = 'aBc24'

string_ex3 = 'AbC24'
string_ex4 = 'aBc24'

如果我比较彼此,我想要两个字符串相等的结果。 例如'AbC' == 'aBc', '024' == '24'

我已经知道如果我用\w+和\d+来区分它们并分别转换为小写和int,我会得到一个结果说两个字符串是相同的。但我想知道是否有一些更简单的功能可以做到这一点。

string1_str = lower(re.findall('\w+', string_ex1))
string1_int = int(re.findall('\d+', string_ex1))
string2_str = lower(re.findall('\w+', string_ex2))
string2_int = int(re.findall('\d+', string_ex2))

if string1_str == string2_str and string1_int == string2_int:
    print('identical')

*编辑 比较应该适用于 string_ex1、string_ex2 和 string_ex3、string_ex4

没有内置的方法可以做到这一点。我建议对于这两个字符串,您都可以找到组:只有字母,或者只有数字,并以小写形式比较它们并且没有前导零

def test(str1, str2):
    values1 = re.findall("([a-z]+|[0-9]+)", str1, flags=re.I)
    values2 = re.findall("([a-z]+|[0-9]+)", str2, flags=re.I)
    clean = lambda x: x.lower().lstrip("0")
    return all(a == b for a, b in zip(map(clean, values1), map(clean, values2)))

print(test('AbC024', 'aBc24'))  # True

您可以使用删除前导零的正则表达式,然后使用 casefold 比较:

import re

string_ex1 = 'AbC024'
string_ex2 = 'aBc24'

string_ex1 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex1)
string_ex2 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex2)

print(string_ex1.casefold() == string_ex2.casefold())
# True

或者,您可以在调用 re.sub 时对两个字符串调用 lower

import re

string_ex1 = 'AbC024'
string_ex2 = 'aBc24'

string_ex1 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex1.lower())
string_ex2 = re.sub(r'(?<=\D)0+(?=\d)', '', string_ex2.lower())

print(string_ex1 == string_ex2)