XPath 在 Python 中获取 Youtube 视频描述的全文？

Question

我正在尝试使用 Xpath 和 lxml 获取给定 Youtube 视频的描述文本，但它只返回描述的前几句话，然后返回“...”。所以它缩短了，我想知道我的 xpath 是否有问题或者它是否总是这样？我还没有看到任何相关的主题。

from lxml import html
import requests
import urllib3

url = "https://www.youtube.com/watch?v=Baur2Ypgd60"

page=requests.get(url)     

tree = html.fromstring(page.text)
s=tree.xpath('//meta[@name="description"]/@content')
print(s)

这只会打印：[“2020 年最佳之选今年面临挑战——但你无法阻止这列火车。全球#GoProFamily 以创造力、韧性和团结应对逆境。你……”] ,

而不是描述的全文：[“2020 年的最佳选择今年有它的挑战——但你不能停止这列火车。全球#GoProFamily 以创造力、韧性和团结迎接逆境。你永远不要忘记你的激情，即使这意味着在你的客厅里练习它们。我们很感激，受到鼓舞，+ 渴望未来。”]

这似乎是一个简单的修复，但我对 XPath 的东西不太熟悉，在任何地方都找不到任何关于这个的东西。谢谢！

Answer 1

问题是在元描述标签中只包含

The Best of 2020 This year had its challenges—but you can't stop this train. A global #GoProFamily met adversity with creativity, resilience, + unity. You...

但是你想要得到的是这个div:

<div id="description" slot="content" class="style-scope ytd-video-secondary-info-renderer"></div>

这里有洞视频说明

但是获取描述的最聪明的方法是使用 Youtube API。

XPath 在 Python 中获取 Youtube 视频描述的全文？

XPath get full text of Youtube Video description in Python?

python

youtube

xpath

lxml