同一个 PyQuery 对象的不同输出
Different Output From Same PyQuery Object
我正在使用 scrapy 来抓取网站。
with open('test.html', 'wb') as f:
f.write(response.body)
我用这个块将正文写入文件。当我打开文件时,我可以看到许多 "a" 标签。
当我打印与打印相同的东西时。它只显示两个 "a" 标签
print response.body
你知道这里发生了什么吗?
我已经解决了问题。被抓取的网站在组合框中有第二个 <html>
标记。
我正在使用 PyQuery,如果 html 结构中的标签有任何问题,PyQuery 将无法正常工作。
现在我已将选择器更改为 xpath,现在它可以找到 html 中的所有标签。
我正在使用 scrapy 来抓取网站。
with open('test.html', 'wb') as f:
f.write(response.body)
我用这个块将正文写入文件。当我打开文件时,我可以看到许多 "a" 标签。
当我打印与打印相同的东西时。它只显示两个 "a" 标签
print response.body
你知道这里发生了什么吗?
我已经解决了问题。被抓取的网站在组合框中有第二个 <html>
标记。
我正在使用 PyQuery,如果 html 结构中的标签有任何问题,PyQuery 将无法正常工作。
现在我已将选择器更改为 xpath,现在它可以找到 html 中的所有标签。