如何使用 xpath scrapy 在标签中 select 文本?
How to select text in a tag with xpath scrapy?
我想select这些标签里面的文字,我怎么select他们(我想select名字和评论在post上Facebook 粉丝专页)?
- 我有 2 个这样的 div 标签
<div class="_2b05">
<a href="/profile.php?id=100003980635623&fref=nf&rc=p&__tn__=R">
<div class="_7_cb _3-8m">
<i class="_3-8_ img sp_VfPHLawdqPX sx_0636a9"></i>
Fan cứng
</div>
Hải Ka
</a>
</div><div data-commentid="511961943618859" data-sigil="comment-body">
Ráng lướt rồi cũng sẽ qua<span class="_5mfr"><span class="_6qdm" style="height: 16px; width: 16px; font-size: 16px; background-image: url("https://static.xx.fbcdn.net/images/emoji.php/v9/t81/1/16/1f60c.png")"></span></span></div>
<div class="_2b05">
<a href="/leminhnhut2110?fref=nf&rc=p&__tn__=R">
Lê Minh Nhựt</a>
</div>
<div data-commentid="511968943618159" data-sigil="comment-body">Làm ngụm Oolong cho phẻ m.n êijii</div>
我通过像这样使用 xpath 成功 select 评论
response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')
但是名字和粉丝标签有一些问题。我使用了这个 xpath:
response.xpath('//div[contains(@data-sigil,"comment-body")]//preceding-sibling::div/a/text()')
如果没有粉丝文本,则只显示评论的用户名。我怎样才能跳过粉丝文本,只选择包含用户名的文本?谢谢
一些关于它的照片:
带粉丝文字:
没有范文:
更新:抱歉,我的问题不是粉丝文字。你可以阅读我和先生 F.Hoque 之间的对话以了解更多信息。谢谢
response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')
输出:
(上面的xpath选择会return下面的输出)
Ráng lướt rồi cũng sẽ qua
Làm ngụm Oolong cho phẻ m.n êijii
Select用户名:
response.xpath('//div[@class="_2b05"]/a/text()')
输出:
Hải Ka
Lê Minh Nhựt
我想select这些标签里面的文字,我怎么select他们(我想select名字和评论在post上Facebook 粉丝专页)?
- 我有 2 个这样的 div 标签
<div class="_2b05">
<a href="/profile.php?id=100003980635623&fref=nf&rc=p&__tn__=R">
<div class="_7_cb _3-8m">
<i class="_3-8_ img sp_VfPHLawdqPX sx_0636a9"></i>
Fan cứng
</div>
Hải Ka
</a>
</div><div data-commentid="511961943618859" data-sigil="comment-body">
Ráng lướt rồi cũng sẽ qua<span class="_5mfr"><span class="_6qdm" style="height: 16px; width: 16px; font-size: 16px; background-image: url("https://static.xx.fbcdn.net/images/emoji.php/v9/t81/1/16/1f60c.png")"></span></span></div>
<div class="_2b05">
<a href="/leminhnhut2110?fref=nf&rc=p&__tn__=R">
Lê Minh Nhựt</a>
</div>
<div data-commentid="511968943618159" data-sigil="comment-body">Làm ngụm Oolong cho phẻ m.n êijii</div>
我通过像这样使用 xpath 成功 select 评论
response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')
但是名字和粉丝标签有一些问题。我使用了这个 xpath:
response.xpath('//div[contains(@data-sigil,"comment-body")]//preceding-sibling::div/a/text()')
如果没有粉丝文本,则只显示评论的用户名。我怎样才能跳过粉丝文本,只选择包含用户名的文本?谢谢
一些关于它的照片:
更新:抱歉,我的问题不是粉丝文字。你可以阅读我和先生 F.Hoque 之间的对话以了解更多信息。谢谢
response.xpath('//div[contains(@data-sigil,"comment-body")]/text()')
输出:
(上面的xpath选择会return下面的输出)
Ráng lướt rồi cũng sẽ qua
Làm ngụm Oolong cho phẻ m.n êijii
Select用户名:
response.xpath('//div[@class="_2b05"]/a/text()')
输出:
Hải Ka
Lê Minh Nhựt