Scrapy:当文本后有一段时间时,在没有 class 的情况下提取 li 中的文本
Scrapy: extract text in li without a class inside when there is some time a strong after text
我在尝试获取 <li>
中的文本时遇到问题,因为有时里面有 <strong>
有时没有。
<div class="short-description" itemprop="description">
<div class="std">
<ul>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Diseñada para trabajar con agua limpia como pueden ser bombeos de pozos y manantiales o en sistemas de riego</li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Uso industrial y agrícola</li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Altura máxima: <strong>30 m</strong></li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Flujo máximo <strong>120 L/min</strong></li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Profundidad de inmersión máxima: <strong>80 m</strong></li>
</ul>
</div>
</div>
尝试:
response.xpath('//*[@class="std"]/ul/li//text()') #use .get() or .getall()
我在尝试获取 <li>
中的文本时遇到问题,因为有时里面有 <strong>
有时没有。
<div class="short-description" itemprop="description">
<div class="std">
<ul>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Diseñada para trabajar con agua limpia como pueden ser bombeos de pozos y manantiales o en sistemas de riego</li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Uso industrial y agrícola</li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Altura máxima: <strong>30 m</strong></li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Flujo máximo <strong>120 L/min</strong></li>
<li><span class="orange-caret"><i class="fas fa-caret-right"></i></span>Profundidad de inmersión máxima: <strong>80 m</strong></li>
</ul>
</div>
</div>
尝试:
response.xpath('//*[@class="std"]/ul/li//text()') #use .get() or .getall()