明智地抓取完整的 HTML 标签

Scrape complete HTML tag wise

假设我有一个 HTML 页面作为

<p> Some text here </p>
<p> Some other text here </p>
<h1> Title 1 </h1>
<p> Another text here </p>
<p> Some random text here </p>
<h1> Title 2 </h1>
<p> Some text here </p>
<p> Some other text here </p>
<h1>..<h1>

是否可以通过标签抓取内容的标签

if (<h1>)
then do something

if (<p>)
then do something else

对于每个标签

php getElementsByTagName() select 标签名称元素。如果你把 * 放在函数参数中,它 return 所有元素。

$dom = new DOMDocument();
$dom->loadHTML($html);
foreach ($dom->getElementsByTagName('*') as $element){
    if ($element->tagName == "h1")
        // do something
    if ($element->tagName == "p")
        // do something
}

检查结果 demo