执行 google 搜索和 return 结果数

perform a google search and return the number of results

Google 网络搜索 API 似乎已失效(旧的 SOAP 和较新的 AJAX)。有没有一种快速搜索 Google 字符串和 return 结果数的方法?我想我只需要 运行 搜索并抓取结果,但我很想知道是否有更好的方法。

更新:事实证明,任何不使用新 API https://developers.google.com/custom-search/json-api/v1/overview 的 Google 自动访问都违反了他们的服务条款,并且因此不推荐。

还有a free API,但这里有一个屏幕抓取:

import requests
from bs4 import BeautifulSoup
import argparse

parser = argparse.ArgumentParser(description='Get Google Count.')
parser.add_argument('word', help='word to count')
args = parser.parse_args()

r = requests.get('http://www.google.com/search',
                 params={'q':'"'+args.word+'"',
                         "tbs":"li:1"}
                )

soup = BeautifulSoup(r.text)
print soup.find('div',{'id':'resultStats'}).text

结果:

$ python g.py jones
About 223,000,000 results
$ python g.py smith
About 325,000,000 results
$ python g.py 'smith and jones'
About 54,200,000 results
$ python g.py 'alias smith and jones'
About 181,000 results