Webscrape Google 电影 Goutte/Guzzle:"region" 问题
Webscrape Google Movies with Goutte/Guzzle: "region" issue
我用 Goutte to grab some movie showtimes for some application. I use this king of URL, for instance : http://www.google.fr/movies?view=list&date=3&tid=4f451a87a71bfa51 创建了一个简单的网络爬虫。
代码无法在我的生产服务器上运行,我终于注意到 Google 电影不会根据请求者的位置显示结果。剧院在法国,它显然是在这个国家工作,据我所知也在德国工作,但不是在我的生产服务器位置荷兰。
有人遇到过这样的问题吗?我想我可以用代理解决这个问题,但它似乎有点复杂(我是否必须为此目的在法国设置一个新服务器?);也许有办法调整对 Google 电影的 HTTP 请求?
提前致谢。
好的,我找到了。诀窍是在查询字符串中添加一个 "near" 参数,其中包含国家或地区名称。似乎 "tid" 不足以识别剧院。
希望这对某人有所帮助。
我用 Goutte to grab some movie showtimes for some application. I use this king of URL, for instance : http://www.google.fr/movies?view=list&date=3&tid=4f451a87a71bfa51 创建了一个简单的网络爬虫。
代码无法在我的生产服务器上运行,我终于注意到 Google 电影不会根据请求者的位置显示结果。剧院在法国,它显然是在这个国家工作,据我所知也在德国工作,但不是在我的生产服务器位置荷兰。
有人遇到过这样的问题吗?我想我可以用代理解决这个问题,但它似乎有点复杂(我是否必须为此目的在法国设置一个新服务器?);也许有办法调整对 Google 电影的 HTTP 请求?
提前致谢。
好的,我找到了。诀窍是在查询字符串中添加一个 "near" 参数,其中包含国家或地区名称。似乎 "tid" 不足以识别剧院。
希望这对某人有所帮助。