如何使用简单htmldom提取原始html代码
how to extract raw html code using simplehtmldom
我正在尝试使用简单htmldom 从网页中提取原始 html。我想知道是否可以使用该库。
例如,假设我有这个网页,我正试图从中提取数据。
<div class="class1">
<div class="class2">
<div class="class3">
<p>p1</p>
<h1>header here!</h1>
<p>p2</p>
<img src="someimage"></img>
</div>
</div>
</div>
我的目标是提取 div class3 中的所有内容,包括原始 html 代码,这样当我获得数据时,我可以将其输入到允许输入源代码的文本框中,因此它是格式与网页相同。
我查看了简单的htmldom 手册并进行了一些搜索,但尚未找到解决方案。
谢谢。
使用您的示例 html 字符串
$html = str_get_html('<div class="class1">
<div class="class2">
<div class="class3">
<p>p1</p>
<h1>header here!</h1>
<p>p2</p>
<img src="someimage"></img>
</div>
</div>
</div>');
// Find all divs with class3
foreach($html->find('div[class=class3]') as $element) {
echo $element->outertext;
}
我正在尝试使用简单htmldom 从网页中提取原始 html。我想知道是否可以使用该库。
例如,假设我有这个网页,我正试图从中提取数据。
<div class="class1">
<div class="class2">
<div class="class3">
<p>p1</p>
<h1>header here!</h1>
<p>p2</p>
<img src="someimage"></img>
</div>
</div>
</div>
我的目标是提取 div class3 中的所有内容,包括原始 html 代码,这样当我获得数据时,我可以将其输入到允许输入源代码的文本框中,因此它是格式与网页相同。
我查看了简单的htmldom 手册并进行了一些搜索,但尚未找到解决方案。
谢谢。
使用您的示例 html 字符串
$html = str_get_html('<div class="class1">
<div class="class2">
<div class="class3">
<p>p1</p>
<h1>header here!</h1>
<p>p2</p>
<img src="someimage"></img>
</div>
</div>
</div>');
// Find all divs with class3
foreach($html->find('div[class=class3]') as $element) {
echo $element->outertext;
}