Python lxml xpath 不工作

Python lxml xpath not working

下面是一个打印 link 中教授姓名的简单程序:http://cse.iitkgp.ac.in/index.php?secret=d2RkOUgybWlNZzJwQXdLc28wNzh6UT09

xpath 查询 //font[1]/b/a/b/text() 给出了单独测试时的输出名称。然而,这个程序给出了一个空列表作为输出。知道我在这里做错了什么吗?

import sys
import requests
import lxml.html

def getdata():
    v = lxml.html.document_fromstring(requests.get("http://cse.iitkgp.ac.in/index.php?secret=d2RkOUgybWlNZzJwQXdLc28wNzh6UT09").content)
    profs = v.xpath('//font[1]/b/a/b/text()')
    for prof in profs:
        print prof

if __name__=="__main__":
    getdata()

该页面使用 AJAX 呈现,即:您需要的元素列表是通过 JavaScript 加载的。

这是实际提供数据的URL:

http://cse.iitkgp.ac.in/faculty4.php?_=1451158710268

我通过使用 Chromium 中的开发者工具查找 XHR 请求找到了它。