用于在 html 中抓取某些语法的正则表达式替代方案

Question

我有函数并放置在 html 代码中。这些函数具有以下语法规则：

这不是我真正的功能，但它给出了上述规则的全部概念：

<html>
#v123w(r(!@3o=?w){
<div></div>
}#
#131ie_w(13gf$>&*()(*&){
<div></div>
}#
</html>

一直以来，我都在使用这个正则表达式来捕获函数中的所有函数名称、参数和 html 字符串：

#(\w+)\(*([\w\d\s\=\>\<\[\]\"\'\)\(\&\|\*\+\-\%\@\^\?\/$\.\!]*)\)\)*{((?:(?R)|.)*?)}#

这是结果：

您可以在正则表达式测试器中查看详细信息： https://regex101.com/r/HdCeeV/1

目前我发现 php 中的 preg_match_all 函数不适用于长字符串。因此，如果函数中的 html 代码太长，我将无法使用此正则表达式。我需要捕获函数名称、函数参数和函数内部的 html 字符串。这个正则表达式有其他选择吗？也许使用 PHP 文件函数，如 substr、strpos 等？

Answer 1

这是对你的正则表达式的改进，效率更高了一点：

#(\w+)\(([\w\s=><[\]"')(&|*+%@^?\/$.!-]*)\){(.+?)}#

Regular expression alternative for scraping certain syntax inside html