使用 Python Scrapy Pandas 从网上商店抓取 table(CSS 构建)

Scraping a table (CSS build) from online store with Python Scrapy Pandas

我尝试从在线商店购买干净的 table - 带有“Technische Daten”的部分 - https://www.coolblue.de/produkt/863600/aeg-l6fb64470.html#product-specifications

我使用的 CSS 选择器是 section.js-specifications-section

response.css('section.js-specifications-section').extract()

是否可以将这些数据提取为简单的 HTML(未格式化)table?

您需要遍历 table 中的每个规范项。实现方法如下

data = {}
for spec in response.css('section.js-specifications-section dl'):
    key = ''.join(spec.css('dt ::text').extract()).strip()
    val = ''.join(spec.css('dd ::text').extract()).strip()
    data[key] = val
print(data)

这将为您提供所有规格的字典。您可以根据需要格式化它。