Goutte 提取带有标签的文本

Goutte extract text with tags

在尝试学习和使用 Goutte 抓取网站描述时,它确实检索了文本但删除了所有标签(即 <br><b>)。 有没有办法检索 div 中所有文本的值,包括 html 标签? 或者是否有更简单的替代方法可以让我具备这种能力?

    <?php 
            require_once "vendor/autoload.php";
            use Goutte\Client;

            // Init. new client
            $client = new Client();
            $crawler = $client->request('GET', "examplesite.com/example");

            // Crawl response
            $description = $crawler->filter('element.class')->extract('_text');
    ?>

您可以使用 html() 函数

http://api.symfony.com/4.0/Symfony/Component/DomCrawler/Crawler.html#method_html

像这样

$descriptions = $crawler->filter('element.class')->each(function($node) {
    return $node->html();
})

使用strip_tagsPHP功能清理后

http://php.net/manual/fr/function.strip-tags.php