正则表达式匹配具有特定属性的 HTML 标签

RegEx to match against HTML tags with certain attributes

我正在尝试编写一个 RegEx 来匹配带有 class 属性的开始 HTML 标签。就像下面这样:

<!-- these should match -->
<div class=" 
<div class=">
<img src="image.jpg" class="
<img src="image.jpg" class=">

<!-- these should not match -->
<div> class="
</div class=">

到目前为止我有:

<[^/^>]+>

这与任何开始的 HTML 标签匹配。我希望对其进行调整以在其中查找 class 属性,就像上面的示例一样。

试试这个:

<[[a-z]{1,} class=">?

这真的很简单,只会匹配您的示例。如果您想在任何地方捕获任何带有 class 属性的开始标记,您将不得不做一些更复杂的事情。

另外,我喜欢用这个: https://regex101.com/

用于测试在线正则表达式,一个非常有用的小操场。