Scrapy 如何从 data-href 获取值
Scrapy How to Get Values from data-href
我正在尝试从 https://www.media.mit.edu/groups
中抓取一堆 link 或可以附加到根域的东西来制作 link
html 本身看起来像这样:
<div class="container-item listing-layout-item selectorgadget_selected" data-href="/groups/viral-communications/overview/" '="">
<div class="container-item listing-layout-item selectorgadget_suggested" data-href="/groups/social-machines/overview/" '="">
<div class="container-item listing-layout-item selectorgadget_suggested" data-href="/groups/space-enabled/overview/" '="">
link 数据存储在 data-href
部分,我一直在尝试使用 CSS 选择器来获取这些数据。
我在使用Scrapy的时候shell,一直在尝试使用
response.css('.data-href::text').extract()
但它 returns 是一个空列表。
如有任何建议,我们将不胜感激!
尝试使用
response.xpath('//div/@data-href').extract()
获取所需的值
我正在尝试从 https://www.media.mit.edu/groups
中抓取一堆 link 或可以附加到根域的东西来制作 linkhtml 本身看起来像这样:
<div class="container-item listing-layout-item selectorgadget_selected" data-href="/groups/viral-communications/overview/" '="">
<div class="container-item listing-layout-item selectorgadget_suggested" data-href="/groups/social-machines/overview/" '="">
<div class="container-item listing-layout-item selectorgadget_suggested" data-href="/groups/space-enabled/overview/" '="">
link 数据存储在 data-href
部分,我一直在尝试使用 CSS 选择器来获取这些数据。
我在使用Scrapy的时候shell,一直在尝试使用
response.css('.data-href::text').extract()
但它 returns 是一个空列表。
如有任何建议,我们将不胜感激!
尝试使用
response.xpath('//div/@data-href').extract()
获取所需的值