如何使用 Import.io 抓取多个页面
How to scrape multiple pages with Import.io
我正在尝试从站点 http://www.cityoflondon.gov.uk/events/ 抓取事件列表,但是当使用 import.io 抓取它时,我只能提取第一页。
如何一次提取所有页面?
您可以使用此网站提取数据,使用爬虫或使用批量提取。上面的网站使用了一种非常简单的分页形式:
http://www.cityoflondon.gov.uk/events/Pages/default.aspx
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37
这是我为上述 URL 创建的数据集,其中应包含所有相关信息。
319aebad-88ea-4053-a649-2087011ce041
如果您对某个网站有进一步的疑问,请联系支持@import.io
谢谢!
梅格
我正在尝试从站点 http://www.cityoflondon.gov.uk/events/ 抓取事件列表,但是当使用 import.io 抓取它时,我只能提取第一页。
如何一次提取所有页面?
您可以使用此网站提取数据,使用爬虫或使用批量提取。上面的网站使用了一种非常简单的分页形式:
http://www.cityoflondon.gov.uk/events/Pages/default.aspx
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37
这是我为上述 URL 创建的数据集,其中应包含所有相关信息。
319aebad-88ea-4053-a649-2087011ce041
如果您对某个网站有进一步的疑问,请联系支持@import.io
谢谢! 梅格