PHP - DomXPath 空标签
PHP - DomXPath empty tags
我有一个 html 文本。
$htmlString = '
<span class="title">Random title</span>
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Labore aperiam aut iusto quae error tempore nisi consequuntur natus magni fugiat illum, repellat minima quibusdam aliquam dolor deserunt repudiandae quas, laboriosam.
<div class="title">Title with missing <i></i><i></i><i></i><i></i></div>
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Labore aperiam aut iusto quae error tempore nisi consequuntur natus magni fugiat illum, repellat minima quibusdam aliquam dolor deserunt repudiandae quas, laboriosam.
';
从此html我要每一个
带有 'title' class 的标签。所以我这样做了:
$document = new DOMDocument();
$document->loadHTML($htmlString);
$finder = new DomXPath($document);
$elements = $finder->query("//*[contains(concat(' ', @class, ' '), ' title ')]");
foreach($elements as $index => $element) {
echo $element->ownerDocument->saveXML( $element ) . PHP_EOL;
}
它工作得很好,但如果有一个空标签
在文本中它不能正常工作。
如您所见,空的 <i></i>
标签变成了 </i>
。我需要带有空标签的文本。
所以我将代码更改为:
$document = new DOMDocument();
$document->loadHTML($htmlString);
$finder = new DomXPath($document);
$elements = $finder->query("//*[contains(concat(' ', @class, ' '), ' title ')]");
foreach($elements as $index => $element) {
//echo $element->ownerDocument->saveXML( $element ) . PHP_EOL;
echo $element->ownerDocument->saveHTML( $element ) . PHP_EOL; //this is working, but i cant use it becase the php version. im using 5.3.3-7 php version
//http://php.net/manual/en/domdocument.savehtml.php
}
及其工作原理。但是在服务器上,php 版本早于 5.4,所以我不能像这样使用 saveHTML 方法。
我该怎么做?
顺便说一句,我正在使用的 php 版本是 5.3.3-7
完整代码在这里:http://sandbox.onlinephpfunctions.com/code/23f5629cbd5a4ae031efc5e3c8ca419043b5a158
foreach($elements as $index => $element) {
$dom = new DOMDocument();
$dom->appendChild($dom->importNode($element,true));
echo $dom->saveHTML();
}
我有一个 html 文本。
$htmlString = '
<span class="title">Random title</span>
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Labore aperiam aut iusto quae error tempore nisi consequuntur natus magni fugiat illum, repellat minima quibusdam aliquam dolor deserunt repudiandae quas, laboriosam.
<div class="title">Title with missing <i></i><i></i><i></i><i></i></div>
Lorem ipsum dolor sit amet, consectetur adipisicing elit. Labore aperiam aut iusto quae error tempore nisi consequuntur natus magni fugiat illum, repellat minima quibusdam aliquam dolor deserunt repudiandae quas, laboriosam.
';
从此html我要每一个 带有 'title' class 的标签。所以我这样做了:
$document = new DOMDocument();
$document->loadHTML($htmlString);
$finder = new DomXPath($document);
$elements = $finder->query("//*[contains(concat(' ', @class, ' '), ' title ')]");
foreach($elements as $index => $element) {
echo $element->ownerDocument->saveXML( $element ) . PHP_EOL;
}
它工作得很好,但如果有一个空标签 在文本中它不能正常工作。
如您所见,空的 <i></i>
标签变成了 </i>
。我需要带有空标签的文本。
所以我将代码更改为:
$document = new DOMDocument();
$document->loadHTML($htmlString);
$finder = new DomXPath($document);
$elements = $finder->query("//*[contains(concat(' ', @class, ' '), ' title ')]");
foreach($elements as $index => $element) {
//echo $element->ownerDocument->saveXML( $element ) . PHP_EOL;
echo $element->ownerDocument->saveHTML( $element ) . PHP_EOL; //this is working, but i cant use it becase the php version. im using 5.3.3-7 php version
//http://php.net/manual/en/domdocument.savehtml.php
}
及其工作原理。但是在服务器上,php 版本早于 5.4,所以我不能像这样使用 saveHTML 方法。
我该怎么做?
顺便说一句,我正在使用的 php 版本是 5.3.3-7
完整代码在这里:http://sandbox.onlinephpfunctions.com/code/23f5629cbd5a4ae031efc5e3c8ca419043b5a158
foreach($elements as $index => $element) {
$dom = new DOMDocument();
$dom->appendChild($dom->importNode($element,true));
echo $dom->saveHTML();
}