RegEx 捕获两个字符串之间的所有内容,但避免捕获逗号
RegEx to capture everything between two strings but avoid capturing commas
你好 Whosebug 社区 请查看以下印刷品:
如您所见,我捕获了 <title>
和 </title>
括号之间的所有内容,但我想避免捕获文本中可能存在的任何逗号。
目前我得到:
Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4", 3/8" & 1/2" Drive Monster Green
我想得到的:
Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4" 3/8" & 1/2" Drive Monster Green
我需要一个单行正则表达式命令来为我做这件事。有任何想法吗?
这是我使用的正则表达式命令:
(?<=<title\>)(.*?)(?=\s*\<)
示例文本是:
<title>Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4", 3/8" & 1/2" Drive Monster Green</title>
我正在使用 Kantu 浏览器自动化来提取一些网页的标题。请记住,我正在抓取整个网页 HTML。
如果不可能做到这一点,那么匹配到第一个逗号然后是return,例如return this:
Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4"
感谢您的宝贵时间。
如评论中所述,正则表达式不能改变匹配的文本,它只是匹配或不匹配。
如果您愿意在第一个逗号处停止匹配,而不是包括所有其余的并删除逗号,您可以使用此:
(?<=<title\>)(.*?)(?=(,|\s*<\/title>))
你好 Whosebug 社区 请查看以下印刷品:
如您所见,我捕获了 <title>
和 </title>
括号之间的所有内容,但我想避免捕获文本中可能存在的任何逗号。
目前我得到:
Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4", 3/8" & 1/2" Drive Monster Green
我想得到的:
Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4" 3/8" & 1/2" Drive Monster Green
我需要一个单行正则表达式命令来为我做这件事。有任何想法吗?
这是我使用的正则表达式命令:
(?<=<title\>)(.*?)(?=\s*\<)
示例文本是:
<title>Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4", 3/8" & 1/2" Drive Monster Green</title>
我正在使用 Kantu 浏览器自动化来提取一些网页的标题。请记住,我正在抓取整个网页 HTML。
如果不可能做到这一点,那么匹配到第一个逗号然后是return,例如return this:
Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4"
感谢您的宝贵时间。
如评论中所述,正则表达式不能改变匹配的文本,它只是匹配或不匹配。
如果您愿意在第一个逗号处停止匹配,而不是包括所有其余的并删除逗号,您可以使用此:
(?<=<title\>)(.*?)(?=(,|\s*<\/title>))