用单引号或双引号解析 html

parse html with single or double quotes

使用 parse 方言时,如何解析属性被 ' 或 '"` 包围的标签,如:

thru <h2 class="txt-medium txt-bold">

thru <h2 class='txt-medium txt-bold'>

一种方法是:

thru {<h2 class=} thru {txt-medium txt-bold} thru ">"

尝试使用 | 或运算符但没有成功。我可以使用 | 运算符来解析标签吗?

是的,您可以使用 | 运算符,但在这种情况下定义一个字符集更好:

delimiter: charset [#"^"" #"'"]
single: {<h2 class='txt-medium txt-bold'>}
double: {<h2 class="txt-medium txt-bold">}

>> parse single [thru "class=" delimiter copy values to delimiter thru ">"] values
== "txt-medium txt-bold"

>> parse double [thru "class=" delimiter copy values to delimiter thru ">"] values 
== "txt-medium txt-bold"

黄金法则是尽可能避免 tothru 并定义要匹配的内容。