Goutte 提取带有标签的文本
Goutte extract text with tags
在尝试学习和使用 Goutte 抓取网站描述时,它确实检索了文本但删除了所有标签(即 <br><b>
)。
有没有办法检索 div 中所有文本的值,包括 html 标签?
或者是否有更简单的替代方法可以让我具备这种能力?
<?php
require_once "vendor/autoload.php";
use Goutte\Client;
// Init. new client
$client = new Client();
$crawler = $client->request('GET', "examplesite.com/example");
// Crawl response
$description = $crawler->filter('element.class')->extract('_text');
?>
您可以使用 html()
函数
http://api.symfony.com/4.0/Symfony/Component/DomCrawler/Crawler.html#method_html
像这样
$descriptions = $crawler->filter('element.class')->each(function($node) {
return $node->html();
})
使用strip_tags
PHP功能清理后
在尝试学习和使用 Goutte 抓取网站描述时,它确实检索了文本但删除了所有标签(即 <br><b>
)。
有没有办法检索 div 中所有文本的值,包括 html 标签?
或者是否有更简单的替代方法可以让我具备这种能力?
<?php
require_once "vendor/autoload.php";
use Goutte\Client;
// Init. new client
$client = new Client();
$crawler = $client->request('GET', "examplesite.com/example");
// Crawl response
$description = $crawler->filter('element.class')->extract('_text');
?>
您可以使用 html()
函数
http://api.symfony.com/4.0/Symfony/Component/DomCrawler/Crawler.html#method_html
像这样
$descriptions = $crawler->filter('element.class')->each(function($node) {
return $node->html();
})
使用strip_tags
PHP功能清理后