尝试使用 python、pypeteer 进行 websrap
Trying to websrap with python, pypeteer
目标是从一个跟踪 tiktok 追随者的网站上提取信息,并 post 它在不和谐频道的 console/send 中。当前使用 discord 来启动它,但在控制台中打印它。下面列出的当前代码打印:
[<pyppeteer.element_handle.ElementHandle object at 0x00000214B2703640>]
@bot.command()
async def stats(ctx):
statspage = await browser.newPage()
await statspage.goto('https://livecounts.io/tiktok-live-follower-counter/charlieputh')
t = await statspage.xpath('//*[@id="__next"]/div/div/div[3]/div[2]/div/div/div/div')
print(t)
我希望它 return 符合该页面上列出的关注者数量。请帮忙。
page.xpath
函数为您提供元素列表,而不是文本。
如果您想获取元素的文本,则需要对其进行评估,例如:
elements = await statspage.xpath('//*[@id="__next"]/div/div/div[3]/div[2]/div/div/div/div')
text = await page.evaluate("e => e.innerText", elements[0])
您可能知道,pyppeteer 是一个非官方的 Python 版本的 puppeteer,因此您应该查看 documentation of puppeteer to see how it works. And also docs of pyppeteer 以了解 Python 版本之间的差异。
目标是从一个跟踪 tiktok 追随者的网站上提取信息,并 post 它在不和谐频道的 console/send 中。当前使用 discord 来启动它,但在控制台中打印它。下面列出的当前代码打印:
[<pyppeteer.element_handle.ElementHandle object at 0x00000214B2703640>]
@bot.command()
async def stats(ctx):
statspage = await browser.newPage()
await statspage.goto('https://livecounts.io/tiktok-live-follower-counter/charlieputh')
t = await statspage.xpath('//*[@id="__next"]/div/div/div[3]/div[2]/div/div/div/div')
print(t)
我希望它 return 符合该页面上列出的关注者数量。请帮忙。
page.xpath
函数为您提供元素列表,而不是文本。
如果您想获取元素的文本,则需要对其进行评估,例如:
elements = await statspage.xpath('//*[@id="__next"]/div/div/div[3]/div[2]/div/div/div/div')
text = await page.evaluate("e => e.innerText", elements[0])
您可能知道,pyppeteer 是一个非官方的 Python 版本的 puppeteer,因此您应该查看 documentation of puppeteer to see how it works. And also docs of pyppeteer 以了解 Python 版本之间的差异。