正则表达式匹配两个稍微改变的字符串之间的所有文本
RegEx to match all text between two strings that slightly alter
我目前正在开发一个 AIR 应用程序,我正在尝试从一个网站获取特定的文本块,该文本块始终位于两个特定字符串之间,这些字符串包含从页面到页面变化的链接。
看起来像这样:
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>
.
.
_desired content_
.
.
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>
*两个字符串相同
现在,我尝试了几个正则表达式,但都没有成功。总的来说,我只是无法理解正则表达式...
我试过的最后一个表达式是:/(?<=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)(.*)(?=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)/gsi
但那个甚至没有被识别为正则表达式。
非常感谢任何有关该主题的帮助。
提前致谢!
编辑:
感谢Organis的帮助我设法解决了这个问题,不使用正则表达式确实更容易也更好。
这就是我最终做的:
text=text.split("Next Chapter<\/span><\/a><\/p>")[1].split("Previous Chapter<\/a>")[0];
text=text.substring(0,text.lastIndexOf("<p><a href"));
不要使用 RegEx。阅读原因:https://blog.codinghorror.com/parsing-html-the-cthulhu-way/.
提取两个固定 <span style="float: right">Next Chapter</span></a></p>
之间的文本,然后切断最终 <p><a href="**changes**">Previous Chapter</a> <a href="**changes**">
。
我目前正在开发一个 AIR 应用程序,我正在尝试从一个网站获取特定的文本块,该文本块始终位于两个特定字符串之间,这些字符串包含从页面到页面变化的链接。
看起来像这样:
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>
.
.
_desired content_
.
.
<p><a href="**changes**">Previous Chapter</a> <a href="**changes**"><span style="float: right">Next Chapter</span></a></p>
*两个字符串相同
现在,我尝试了几个正则表达式,但都没有成功。总的来说,我只是无法理解正则表达式...
我试过的最后一个表达式是:/(?<=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)(.*)(?=<p><a href=\".+\">Previous Chapter<\/a> <span style=\"float: right\"><a href=\".+\">Next Chapter<\/a><\/span><\/p>)/gsi
但那个甚至没有被识别为正则表达式。
非常感谢任何有关该主题的帮助。
提前致谢!
编辑:
感谢Organis的帮助我设法解决了这个问题,不使用正则表达式确实更容易也更好。 这就是我最终做的:
text=text.split("Next Chapter<\/span><\/a><\/p>")[1].split("Previous Chapter<\/a>")[0];
text=text.substring(0,text.lastIndexOf("<p><a href"));
不要使用 RegEx。阅读原因:https://blog.codinghorror.com/parsing-html-the-cthulhu-way/.
提取两个固定 <span style="float: right">Next Chapter</span></a></p>
之间的文本,然后切断最终 <p><a href="**changes**">Previous Chapter</a> <a href="**changes**">
。