XPath 在 Python 中获取 Youtube 视频描述的全文?
XPath get full text of Youtube Video description in Python?
我正在尝试使用 Xpath 和 lxml 获取给定 Youtube 视频的描述文本,但它只返回描述的前几句话,然后返回“...”。所以它缩短了,我想知道我的 xpath 是否有问题或者它是否总是这样?我还没有看到任何相关的主题。
from lxml import html
import requests
import urllib3
url = "https://www.youtube.com/watch?v=Baur2Ypgd60"
page=requests.get(url)
tree = html.fromstring(page.text)
s=tree.xpath('//meta[@name="description"]/@content')
print(s)
这只会打印:[“2020 年最佳之选 今年面临挑战——但你无法阻止这列火车。全球#GoProFamily 以创造力、韧性和团结应对逆境。你……”] ,
而不是描述的全文:[“2020 年的最佳选择 今年有它的挑战——但你不能停止这列火车。全球#GoProFamily 以创造力、韧性和团结迎接逆境。你永远不要忘记你的激情,即使这意味着在你的客厅里练习它们。我们很感激,受到鼓舞,+ 渴望未来。”]
这似乎是一个简单的修复,但我对 XPath 的东西不太熟悉,在任何地方都找不到任何关于这个的东西。谢谢!
问题是在元描述标签中只包含
The Best of 2020 This year had its challenges—but you can't stop this train. A global #GoProFamily met adversity with creativity, resilience, + unity. You...
但是你想要得到的是这个div
:
<div id="description" slot="content" class="style-scope ytd-video-secondary-info-renderer"></div>
这里有洞视频说明
但是获取描述的最聪明的方法是使用 Youtube API。
我正在尝试使用 Xpath 和 lxml 获取给定 Youtube 视频的描述文本,但它只返回描述的前几句话,然后返回“...”。所以它缩短了,我想知道我的 xpath 是否有问题或者它是否总是这样?我还没有看到任何相关的主题。
from lxml import html
import requests
import urllib3
url = "https://www.youtube.com/watch?v=Baur2Ypgd60"
page=requests.get(url)
tree = html.fromstring(page.text)
s=tree.xpath('//meta[@name="description"]/@content')
print(s)
这只会打印:[“2020 年最佳之选 今年面临挑战——但你无法阻止这列火车。全球#GoProFamily 以创造力、韧性和团结应对逆境。你……”] ,
而不是描述的全文:[“2020 年的最佳选择 今年有它的挑战——但你不能停止这列火车。全球#GoProFamily 以创造力、韧性和团结迎接逆境。你永远不要忘记你的激情,即使这意味着在你的客厅里练习它们。我们很感激,受到鼓舞,+ 渴望未来。”]
这似乎是一个简单的修复,但我对 XPath 的东西不太熟悉,在任何地方都找不到任何关于这个的东西。谢谢!
问题是在元描述标签中只包含
The Best of 2020 This year had its challenges—but you can't stop this train. A global #GoProFamily met adversity with creativity, resilience, + unity. You...
但是你想要得到的是这个div
:
<div id="description" slot="content" class="style-scope ytd-video-secondary-info-renderer"></div>
这里有洞视频说明
但是获取描述的最聪明的方法是使用 Youtube API。