获取 div 中的所有内容作为字符串
Get all content as string inside div
我需要获取 HTML 元素中的所有内容,包括所有子节点和孙节点及其内容,就好像它是一个字符串一样。这是我的预期输出:
<div class="images"><div class="img_100"><a class="img a" legenda="" target="" style=""><img src="/img/site/570/b/random_image.jpg" alt="Lorem ipsum - dolor sit amet" class="portrait"></a></div></div>
我目前正在使用 JS 和 puppeteer 来抓取我需要的页面,但我需要所有 HTML 作为字符串来格式化一些内容,我不知道如何按照我想要的方式获得它。
我还使用此查询 document.querySelectorAll(".page_content_post")
来获取我想要的内容和 child/grandchild 节点的父元素。
提前致谢。
通过class获得parent:
document.getElementsByClassName('.page_content_post').innerHTML
通过 ID 获得 parent:
document.getElementById('#page_content_post').innerHTML
我需要获取 HTML 元素中的所有内容,包括所有子节点和孙节点及其内容,就好像它是一个字符串一样。这是我的预期输出:
<div class="images"><div class="img_100"><a class="img a" legenda="" target="" style=""><img src="/img/site/570/b/random_image.jpg" alt="Lorem ipsum - dolor sit amet" class="portrait"></a></div></div>
我目前正在使用 JS 和 puppeteer 来抓取我需要的页面,但我需要所有 HTML 作为字符串来格式化一些内容,我不知道如何按照我想要的方式获得它。
我还使用此查询 document.querySelectorAll(".page_content_post")
来获取我想要的内容和 child/grandchild 节点的父元素。
提前致谢。
通过class获得parent:
document.getElementsByClassName('.page_content_post').innerHTML
通过 ID 获得 parent:
document.getElementById('#page_content_post').innerHTML