Python 用于匹配和排除某些内容的正则表达式
Python Regex to match and exclude certain content
我正在尝试从字符串中排除一些内容。这是一个例子:
Sony Xperia Z2 m/Smartwatch 2
和:
Sony Xperia Z2 + headphones
我只想得到
Sony Xperia Z2
在这两种情况下。
我已经能够将要删除的字符串与此匹配,但是我如何 select 反转?
到目前为止我得到了什么:
m/([a-zA-Z 0-9]*)
编辑:我添加了另一个案例。
您可以使用:
>>> s = 'Sony Xperia Z2 m/Smartwatch 2'
>>> re.sub(r'\s*m/.*$', '', s)
'Sony Xperia Z2'
使用正则表达式
>>> re.findall(r"[a-zA-Z0-9 ]+(?= m/)", "Sony Xperia Z2 m/Smartwatch 2")
['Sony Xperia Z2']
>>> re.findall(r"[a-zA-Z0-9 ]+(?= m/)", "Sony Xperia Z2 m/Smartwatch 2")[0]
'Sony Xperia Z2'
使用拆分
>>> "Sony Xperia Z2 m/Smartwatch 2".split(" m/")[0]
'Sony Xperia Z2'
类似于:
test = 'Sony Xperia Z2 m/Smartwatch 2'
res = re.search('m/([a-zA-Z 0-9]*)', test)
cleanstr = test.replace(res.group(), '')
print cleanstr
你得到了Sony Xperia Z2
使用正则表达式拆分
re.split(r" m/| \+ ", yourString)[0]
这将适用于您的两个示例:
string1 = "Sony Xperia Z2 m/Smartwatch 2"
print re.split(" m/| \+ ", string1)[0]
# output: Sony Xperia Z2
string2 = "Sony Xperia Z2 + headphones"
print re.split(" m/| \+ ", string2)[0]
# output: Sony Xperia Z2
如果你有更多的分隔符,你可以将它们添加到 split
函数的模式中。
您还可以使用 re.split(...)[1]
检索字符串的第二部分:
string1 = "Sony Xperia Z2 m/Smartwatch 2"
print re.split(" m/| \+ ", string1)[1]
# output: Smartwatch 2
我正在尝试从字符串中排除一些内容。这是一个例子:
Sony Xperia Z2 m/Smartwatch 2
和:
Sony Xperia Z2 + headphones
我只想得到
Sony Xperia Z2
在这两种情况下。
我已经能够将要删除的字符串与此匹配,但是我如何 select 反转? 到目前为止我得到了什么:
m/([a-zA-Z 0-9]*)
编辑:我添加了另一个案例。
您可以使用:
>>> s = 'Sony Xperia Z2 m/Smartwatch 2'
>>> re.sub(r'\s*m/.*$', '', s)
'Sony Xperia Z2'
使用正则表达式
>>> re.findall(r"[a-zA-Z0-9 ]+(?= m/)", "Sony Xperia Z2 m/Smartwatch 2")
['Sony Xperia Z2']
>>> re.findall(r"[a-zA-Z0-9 ]+(?= m/)", "Sony Xperia Z2 m/Smartwatch 2")[0]
'Sony Xperia Z2'
使用拆分
>>> "Sony Xperia Z2 m/Smartwatch 2".split(" m/")[0]
'Sony Xperia Z2'
类似于:
test = 'Sony Xperia Z2 m/Smartwatch 2'
res = re.search('m/([a-zA-Z 0-9]*)', test)
cleanstr = test.replace(res.group(), '')
print cleanstr
你得到了Sony Xperia Z2
使用正则表达式拆分
re.split(r" m/| \+ ", yourString)[0]
这将适用于您的两个示例:
string1 = "Sony Xperia Z2 m/Smartwatch 2"
print re.split(" m/| \+ ", string1)[0]
# output: Sony Xperia Z2
string2 = "Sony Xperia Z2 + headphones"
print re.split(" m/| \+ ", string2)[0]
# output: Sony Xperia Z2
如果你有更多的分隔符,你可以将它们添加到 split
函数的模式中。
您还可以使用 re.split(...)[1]
检索字符串的第二部分:
string1 = "Sony Xperia Z2 m/Smartwatch 2"
print re.split(" m/| \+ ", string1)[1]
# output: Smartwatch 2