如何使用 Python 从 GitHub 中提取评论正文

How to extract comments body from GitHub with Python

我只想提取 API v3 问题的评论正文(但我也愿意接受新的解决方案)。

现在我尝试输入这个地址:(示例)https://api.github.com/repos/bitcoin/bitcoin/issues/comments?per_page=50&since=2018-02-19T00:00:00Z&until=2019-04-20T00:00 : 00Z

输入地址后我读取了所有数据(HTML)但是GitHub不允许您一次查看超过100个结果。可以超过这个限制吗?只能获取评论体吗?

GitHub 的 API 提供 pagination。您不能在单个请求中请求超过 100 条评论,但您可以发出多个请求以检索超过 100 条评论:

Requests that return multiple items will be paginated to 30 items by default. You can specify further pages with the ?page parameter. For some resources, you can also set a custom page size up to 100 with the ?per_page parameter.

API 还包括一个 Link HTTP header,告诉您有趣的页面,例如nextlast 页面是什么。

Can only the comment bodies be obtained?

我不知道有什么方法可以使用 v3/REST API 来做到这一点。使用 v4 / GraphQL API 可能是可行的,但请注意,这使用了完全不同的模型。