如何抓取 Google Play 商店中某个应用的所有评论?
How can I crawl all reviews of an app on Google Play Store?
当我在 Google Play 商店中抓取应用页面时,我只能抓取应用评论的前几页。
(当我使用网络浏览器点击箭头按钮时,会显示应用评论的下一页)
如何抓取其他评论?
我查看了 Telegram 的 Google 播放页面,似乎所有评论都与页面的其余部分一起加载了。
无需单击箭头即可看到评论
点击箭头后,评论部分会变大并显示 full-length 条评论
然后,您可以通过单击向右箭头查看更早的评论和 "less helpful" 评论。
但是,所有这些评论都已从头开始加载:
从那里,您必须使用网络爬虫来解析 HTML 才能获得评论。
编辑
好的,点击箭头几次后,Google Play 开始通过使用某种令牌 ping http://play.google.com/store/getreviews
来加载一些较旧的评论。
这是我收到的回复的片段:
<div class="single-review"> <a href="/store/people/details?id=113340797493751556969">...
它似乎包含所有加载的评论,所以您所要做的就是解析它,或者尝试弄清楚令牌的工作原理,以便您可以自己从 getreviews
中获取。
尽管为时已晚,但您可以使用 BeautifulSoup 库 python 来抓取所有评论。所有评论都在 div 内,有 class 'single-review'。
创建网页html的soup对象,select'single-review'class的所有实例。
soup.select('.single-review')
会为你做的。从评论中提取您想要的任何内容。作为参考,您可能需要查看 BeautifulSoup documentation
您不需要检查右箭头或左箭头。以上方法会给你当前网页上的所有评论。
当我在 Google Play 商店中抓取应用页面时,我只能抓取应用评论的前几页。
(当我使用网络浏览器点击箭头按钮时,会显示应用评论的下一页)
如何抓取其他评论?
我查看了 Telegram 的 Google 播放页面,似乎所有评论都与页面的其余部分一起加载了。
无需单击箭头即可看到评论
点击箭头后,评论部分会变大并显示 full-length 条评论
然后,您可以通过单击向右箭头查看更早的评论和 "less helpful" 评论。
但是,所有这些评论都已从头开始加载:
从那里,您必须使用网络爬虫来解析 HTML 才能获得评论。
编辑
好的,点击箭头几次后,Google Play 开始通过使用某种令牌 ping http://play.google.com/store/getreviews
来加载一些较旧的评论。
这是我收到的回复的片段:
<div class="single-review"> <a href="/store/people/details?id=113340797493751556969">...
它似乎包含所有加载的评论,所以您所要做的就是解析它,或者尝试弄清楚令牌的工作原理,以便您可以自己从 getreviews
中获取。
尽管为时已晚,但您可以使用 BeautifulSoup 库 python 来抓取所有评论。所有评论都在 div 内,有 class 'single-review'。
创建网页html的soup对象,select'single-review'class的所有实例。
soup.select('.single-review')
会为你做的。从评论中提取您想要的任何内容。作为参考,您可能需要查看 BeautifulSoup documentation
您不需要检查右箭头或左箭头。以上方法会给你当前网页上的所有评论。