Scrapy：当文本后有一段时间时，在没有 class 的情况下提取 li 中的文本

Question

我在尝试获取 <li> 中的文本时遇到问题，因为有时里面有 <strong> 有时没有。

<div class="short-description" itemprop="description">
  <div class="std">
    <ul>
      <li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Diseñada para trabajar con agua limpia como pueden ser bombeos de pozos y manantiales o en sistemas de riego</li>
      <li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Uso industrial y agrícola</li>
      <li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Altura máxima: <strong>30 m</strong></li>
      <li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Flujo máximo <strong>120 L/min</strong></li>
      <li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Profundidad de inmersión máxima: <strong>80 m</strong></li>
    </ul>
  </div>
</div>

Answer 1

尝试：

 response.xpath('//*[@class="std"]/ul/li//text()') #use .get() or .getall()

Scrapy：当文本后有一段时间时，在没有 class 的情况下提取 li 中的文本

Scrapy: extract text in li without a class inside when there is some time a strong after text

python

scrapy

web-scraping

scrapy-shell