git 提交哈希是否等于存储库状态?

Does a git commit hash equal a repository state?

每个 git 提交都被归因于一个散列,其中 "signs" 它的内容。 它是否也标记提交的来源,或者只是用于哈希计算的提交数据本身?

措辞不同:是否不可能(除了散列冲突)伪造第二个存储库,其头部提交具有完全相同的散列和相同的内容,但树的其余部分不同?

第二个问题答案是肯定的(不可能等)

第一个问题的格式不如我想的那样好,因为提交哈希实际上只是基于提交数据。导致 second 问题答案的关键是 "the commit data" 包括这些关键项目,您可以在实际提交中看到:

$ git cat-file -p HEAD
tree 22abd5c3fed5e2f49fb71e10b39d8c4929e51fc7
parent 4ebdeb68ba87282f87c39d790ba17fe1e021cc97
parent 9eabf5b536662000f79978c4d1b6e4eff5c8d785
[snip]

tree 行给出了树的散列(仅取决于树的内容)和 parent 行——在本例中为两行,因为 HEAD 是一个merge commit——给出父提交的哈希值。鉴于当前提交的哈希值取决于其树和父项的哈希值,如果您要构建具有不同历史记录或不同树的不同回购协议,那么它们将具有不同的哈希值,以便提交将也有不同的哈希值。

(这里通常使用的技术术语是Merkle Tree。)