Scrapy 如何从 data-href 获取值

Scrapy How to Get Values from data-href

我正在尝试从 https://www.media.mit.edu/groups

中抓取一堆 link 或可以附加到根域的东西来制作 link

html 本身看起来像这样:

<div class="container-item listing-layout-item selectorgadget_selected" data-href="/groups/viral-communications/overview/" '="">   
<div class="container-item listing-layout-item  selectorgadget_suggested" data-href="/groups/social-machines/overview/" '="">
<div class="container-item listing-layout-item  selectorgadget_suggested" data-href="/groups/space-enabled/overview/" '="">

link 数据存储在 data-href 部分,我一直在尝试使用 CSS 选择器来获取这些数据。

我在使用Scrapy的时候shell,一直在尝试使用 response.css('.data-href::text').extract() 但它 returns 是一个空列表。

如有任何建议,我们将不胜感激!

尝试使用

response.xpath('//div/@data-href').extract()

获取所需的值