在 GitPython 中获取第一次提交的差异细节

Get the diff details of first commit in GitPython

在 GitPython 中,我可以通过在不同的提交 object 之间调用 diff() 方法来分别迭代树中每个更改的差异信息。如果我使用 create_patch=True 关键字参数调用 diff(),则会为我可以通过创建的 diff object 访问的每个更改(添加、删除、重命名)创建一个补丁字符串, 并剖析变化。

但是,我没有 parent 可以与第一次提交进行比较。

import git
from git.compat import defenc
repo = git.Repo("path_to_my_repo")

commits = list(repo.iter_commits('master'))
commits.reverse()

for i in commits:

    if not i.parents:
        # First commit, don't know what to do
        continue
    else:
        # Has a parent
        diff = i.diff(i.parents[0], create_patch=True)

    for k in diff:
        try:
            # Get the patch message
            msg = k.diff.decode(defenc)
            print(msg)
        except UnicodeDecodeError:
            continue

可以使用方法

diff = repo.git.diff_tree(i.hexsha, '--', root=True)

但是这会使用给定的参数在整个树上调用 git diff,returns 一个字符串,我无法分别获取每个文件的信息。

也许,有一种方法可以创建某种 root object。我怎样才能获得存储库中的第一个更改?

编辑

一个肮脏的解决方法似乎是通过直接使用 its hash:

来与空树进行比较
EMPTY_TREE_SHA = "4b825dc642cb6eb9a060e54bf8d69288fbee4904"

....

    if not i.parents:
        diff = i.diff(EMPTY_TREE_SHA, create_patch=True, **diffArgs)
    else:
        diff = i.diff(i.parents[0], create_patch=True, **diffArgs)

但这似乎不是真正的解决方案。仍然欢迎其他答案。

简短的回答是你不能。 GitPython好像不支持这个方法。

在提交时执行 git show 是可行的,但是 GitPython 不支持。

另一方面,您可以使用 GitPython 中的 stats 功能来获得一些东西,让您获得所需的信息:

import git

repo = git.Repo(".")

commits = list(repo.iter_commits('master'))
commits.reverse()
print(commits[0])
print(commits[0].stats.total)
print(commits[0].stats.files)

这可能会解决您的问题。如果这不能解决您的问题,您最好尝试使用基于 libgit2 的 pygit2 - VSTS、Bitbucket 和 GitHub 用来处理 Git 的库后端。这可能是更完整的功能。祝你好运。