如何抓取Github中的代码行?

How to crawl lines of codes in Github?

我正在使用 GitHub api 来抓取项目信息(Http,JSON)。
我想爬取某个项目的总代码行数(使用java)。以及不同版本的代码行。
我发现JSON回复里面只有增删改查。

是否只有下载整个源代码然后分析它以获得总代码行数的方法?
GitHub 提供更方便的东西吗?

您可以使用 GitHub API 来计算 number of LOC contributed by a user

但是对于所有项目本身(Git 存储库),您需要先克隆它然后 analyze it locally
this question:

wc -l $(git ls-files)
# or
git diff --stat 4b825dc642cb6eb9a060e54bf8d69288fbee4904

4b825dc642cb6eb9a060e54bf8d69288fbee4904 是结果 git hash-object -t tree /dev/null:参见“git's semi-secret empty tree”)