Scrapy 规则的正则表达式
Regular expression for Scrapy rules
我想从以下格式的页面中抓取数据:http://www.vesselfinder.com/vessels?page=i
其中 i
是从 0
到某个整数。
以下正则表达式是否适用于此模式:
start_urls = [
"http://www.vesselfinder.com/vessels"
]
rules = (
Rule(LinkExtractor(allow=r"com/vessels\?page=[1-100]"),
callback='parse_item', follow=True),
)
我想从以下格式的页面中抓取数据:http://www.vesselfinder.com/vessels?page=i
其中 i
是从 0
到某个整数。
以下正则表达式是否适用于此模式:
start_urls = [
"http://www.vesselfinder.com/vessels"
]
rules = (
Rule(LinkExtractor(allow=r"com/vessels\?page=[1-100]"),
callback='parse_item', follow=True),
)