XBMC (Python) 问题的简单登录功能

Question

我正在尝试通过 python(xbmc/kodi) 抓取 Javascript 日历页面的部分内容。到目前为止，我已经能够抓取静态 html 变量，但不能抓取 JavaScript 生成的部分。

我试图检索的变量是 <strong class="item-title">**this**</strong> , <span class="item-daterange">**this**</span> and <div class="item-location">**this**</div>，请注意它们位于 html 源的不同部分，并通过 JavaScript 呈现。所有这些抓取的变量都应该附加到一个字符串中并显示。

response = net.http_GET('my URL')
    link = response.content
    match=re.compile('<strong class="gcf-item-title">(.+?)</strong>').findall(link)
    for name in match:
        name = name
        print name

从上面的正则表达式我可以只抓取其中一个变量，因为我需要一个字符串列表来一起显示所有变量，那怎么办？

我知道必须预先呈现页面才能抓取 javascript 变量但是由于我使用的是 xbmc ，我不确定如何导入其他 python 库例如干刮来完成这项工作。下载 Dryscrape 给了我一个 setup.py ， init.py 文件以及其他一些文件，但我如何将它们一起使用？

谢谢。

Answer 1

您的问题是关于抓取 JavaScript 的步骤、如何在 XBMC/Kodi 上使用 Python 或如何安装 setup.py文件?

仅根据您上面的正则表达式，如果您的条目总是 like <strong class="item-title">**this**</strong> 您将无法匹配，因为您的 re 模式适用于具有 class="gcf-item-title.

的元素
您正在使用或能够使用 BeautifulSoup？如果你没有使用它，但可以，你应该——它在抓取网站方面改变了生活。

XBMC (Python) 问题的简单登录功能

Simple login function for XBMC (Python) issue

javascript

python

xbmc

web-scraping

kodi