Scrapy：检查网页中的网络资源

Scrapy : inspect network resources in a web page

python
scrapy
scrapy-spider

我才刚刚开始探索 scrappy 框架。

我一直在阅读 scrapy，用于从页面内容中提取 urls/images 等 并进行抓取。

我的问题是，有没有办法像PhantomJS does print all the network resources in a webpage一样extract/print加载网页中的所有网络资源而不从页面的html内容中提取，而是直接来自资源 requested/completed 本身时的网络资源。

谢谢

Scrapy 不渲染网页。

Scrapy 只是从网络服务器获取网页的 html 代码。

所以当Scrapy抓取一个网页时，蜘蛛只访问服务器一次，并不会请求资源，比如图像和javascript文件。

Scrapy：检查网页中的网络资源

Scrapy : inspect network resources in a web page

python

scrapy

scrapy-spider