如何在 lxml 元素中获取全文
How to get full text inside lxml element
我有以下 html:
<span class="episode">Episode: <a href="/title/tt2071912/">
!Que ve el Bisbe!</a>
(2011)
</span>
我如何从中得到年份?当我得到剧集对象时,它只在 <a>
:
之前给我 'text'
result.cssselect('.episode')[0].text
'Episode: '
我目前最好的是:
year = lxml.html.tostring(result.cssselect('.episode')[0]).split('(')[-1].split(')')[0]
使用封闭元素的 .text
property。
我有以下 html:
<span class="episode">Episode: <a href="/title/tt2071912/">
!Que ve el Bisbe!</a>
(2011)
</span>
我如何从中得到年份?当我得到剧集对象时,它只在 <a>
:
result.cssselect('.episode')[0].text
'Episode: '
我目前最好的是:
year = lxml.html.tostring(result.cssselect('.episode')[0]).split('(')[-1].split(')')[0]
使用封闭元素的 .text
property。