RegEx 捕获两个字符串之间的所有内容,但避免捕获逗号

RegEx to capture everything between two strings but avoid capturing commas

你好 Whosebug 社区 请查看以下印刷品:

如您所见,我捕获了 <title></title> 括号之间的所有内容,但我想避免捕获文本中可能存在的任何逗号。

目前我得到:

Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4", 3/8" &amp; 1/2" Drive Monster Green

我想得到的:

Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4" 3/8" &amp; 1/2" Drive Monster Green

我需要一个单行正则表达式命令来为我做这件事。有任何想法吗?

这是我使用的正则表达式命令:

(?<=<title\>)(.*?)(?=\s*\<)

示例文本是:

<title>Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4", 3/8" &amp; 1/2" Drive Monster Green</title>

我正在使用 Kantu 浏览器自动化来提取一些网页的标题。请记住,我正在抓取整个网页 HTML。

如果不可能做到这一点,那么匹配到第一个逗号然后是return,例如return this:

Kincrome K1500G - Tool Workshop Contour 472 Piece 15 Drawer 1/4"

感谢您的宝贵时间。

如评论中所述,正则表达式不能改变匹配的文本,它只是匹配或不匹配。

如果您愿意在第一个逗号处停止匹配,而不是包括所有其余的并删除逗号,您可以使用此:

(?<=<title\>)(.*?)(?=(,|\s*<\/title>))

https://regex101.com/r/PPb1ba/1