Python

Question

我想获取的 .text，但根本行不通。

这是我的代码：

from bs4 import BeautifulSoup
import request

generatedLink = "MyLink"
page = requests.get(generatedLink)
contents = page.text
soup = BeautifulSoup(contents, "html.parser")
name = soup.find('a',class_=["yt-simple-endpoint", "style-scope", "ytd-video-renderer"])

print(name)

它returns"None"

<a id="video-title" class="yt-simple-endpoint style-scope ytd-video-renderer" aria-label="TURNIR 1 VS 1 U LOLU FINALEE!! od korisnika KaLuu Vrijeme streaminga: prije 3 dana 3 sata i 49 minuta 644 pregleda" href="/watch?v=5N4X4hjkzOw" title="TURNIR 1 VS 1 U LOLU FINALEE!!">

TURNIR 1 VS 1 U LOLU FINALEE!!

</a>

我需要从此处的标题中提取文本！

这里出了点问题，但我在代码中找不到那个错误。有人能帮我吗？

Answer 1

虽然网页显示的元素是这样显示的，

<a id="video-title" class="yt-simple-endpoint style-scope ytd-video-renderer" aria-label="VRACAMO SE MNOGO JACIII!!! by KaLuu Streamed 3 days ago 2 hours, 2 minutes 291 views" href="/watch?v=QPNienUChDg" title="VRACAMO SE MNOGO JACIII!!!">
                VRACAMO SE MNOGO JACIII!!!
              </a>

根据请求，HTML 元素正在更改为此。

    <a aria-describedby="description-id-904842" class="yt-uix-sessionlink yt-uix-tile-link spf-link yt-ui-ellipsis yt-ui-ellipsis-2" data-sessionlink="ei=6T6oW7LkMcKKowP9zqLoBQ&amp;feature=c4-overview&amp;ved=CDYQ-SUYACITCPL87M-_0t0CFULFaAodfacIXSibHA" dir="ltr" href="/watch?v=QPNienUChDg" rel="nofollow" title="VRACAMO SE MNOGO JACIII!!!">
VRACAMO SE MNOGO JACIII!!!
</a>

通过观察，您可以看到 class 值从 yt-simple-endpoint style-scope ytd-video-renderer 到 yt-uix-sessionlink yt-uix-tile-link spf-link yt-ui-ellipsis yt-ui-ellipsis-2 的变化。由于客户端的地理位置和其他一些原因，某些网站会发生这种情况。

识别后我通过以下代码得到了值。

import requests
from bs4 import BeautifulSoup
url = 'https://www.youtube.com/channel/UCtBGKF3uQNybKeelFz4PolA'
soup = BeautifulSoup(requests.get(url).content, 'html.parser')
print(soup)
name = soup.find('a', {'class': 'yt-uix-sessionlink yt-uix-tile-link spf-link yt-ui-ellipsis yt-ui-ellipsis-2'})

print(name.text)

希望对您有所帮助！干杯！

Python - BeautifulSoup4 "None" Return？

Python - BeautifulSoup4 "None" Return?

screen-scraping

beautifulsoup