如何更正此正则表达式以从报告中提取系列和图像编号?
How can this regular expression corrected to extract series and image numbers from reports?
我希望从以下文本示例中提取信息:
“(系列 602 图片 91)”
要么
“系列编号 89 和图像编号 34”
要么
"Series # 4, Image # 14"
并希望提取
分别作为值和系列和图像标签的数字。
我目前的尝试:
([(,]series *{\}d+?[,/ ]* *image* {\}d+(/{\}d+)?[),]) *? on_img
使用
/series.*?([0-9]+).*?image.*?([0-9]+)/i
参见proof。 .*?
模式将匹配您的单词之间的任何字符,但尽可能少,因此捕获的数字将最接近这些单词。
我希望从以下文本示例中提取信息:
“(系列 602 图片 91)” 要么 “系列编号 89 和图像编号 34” 要么 "Series # 4, Image # 14" 并希望提取 分别作为值和系列和图像标签的数字。
我目前的尝试:
([(,]series *{\}d+?[,/ ]* *image* {\}d+(/{\}d+)?[),]) *? on_img
使用
/series.*?([0-9]+).*?image.*?([0-9]+)/i
参见proof。 .*?
模式将匹配您的单词之间的任何字符,但尽可能少,因此捕获的数字将最接近这些单词。