如何抓取 Google Play 商店中某个应用的所有评论?

How can I crawl all reviews of an app on Google Play Store?

当我在 Google Play 商店中抓取应用页面时,我只能抓取应用评论的前几页。

(当我使用网络浏览器点击箭头按钮时,会显示应用评论的下一页)

如何抓取其他评论?

我查看了 Telegram 的 Google 播放页面,似乎所有评论都与页面的其余部分一起加载了。

无需单击箭头即可看到评论

点击箭头后,评论部分会变大并显示 full-length 条评论

然后,您可以通过单击向右箭头查看更早的评论和 "less helpful" 评论。

但是,所有这些评论都已从头开始加载:

从那里,您必须使用网络爬虫来解析 HTML 才能获得评论。

编辑

好的,点击箭头几次后,Google Play 开始通过使用某种令牌 ping http://play.google.com/store/getreviews 来加载一些较旧的评论。

这是我收到的回复的片段:

<div class="single-review">  <a href="/store/people/details?id=113340797493751556969">...

它似乎包含所有加载的评论,所以您所要做的就是解析它,或者尝试弄清楚令牌的工作原理,以便您可以自己从 getreviews 中获取。

尽管为时已晚,但您可以使用 BeautifulSoup 库 python 来抓取所有评论。所有评论都在 div 内,有 class 'single-review'。

创建网页html的soup对象,select'single-review'class的所有实例。

soup.select('.single-review')

会为你做的。从评论中提取您想要的任何内容。作为参考,您可能需要查看 BeautifulSoup documentation

您不需要检查右箭头或左箭头。以上方法会给你当前网页上的所有评论。