在 git 存储库的历史记录中查找大文件失败
Finding large files in the history of a git repository fails
我的存储库很大,因为历史上有一些大文件。为了找到大文件并删除它们,我正在执行:
$ git verify-pack -v .git/objects/pack/pack-..e8a.idx | sort -k 3 -n | tail -3
结果类似于:
12eb660ea206e1b7bd42cb8b525aabe9e86a5064 blob 56413247 15833578 5889838
89b377ace5639c0914bb49d28d0c8e97b0f19a16 blob 56414112 15833631 81736530
4ea83fb57b49f7afdbe99e4f043509d184338f5b blob 56426618 15837504 48628334
为了找到最大文件的路径,我运行:
$ git rev-list --objects --all | grep 4ea83fb57b49f
结果是:
4ea83fb57b49f7afdbe99e4f043509d184338f5b path/to/my/large_file
但是,当我 运行 git log
在这个文件上喜欢:
$ git log --oneline --branches -- path/to/my/large_file
没有显示日志。
此外,每当我尝试通过以下方式从历史记录中删除二进制文件时:
$ git filter-branch --index-filter \
'git rm --ignore-unmatch --cached path/to/my/large_file'
我收到:
WARNING: Ref 'refs/heads/master' is unchanged
有什么想法吗?
可能大对象的路径位于不同的分支。在 filter-branch
命令中使用 --all
从所有分支中删除大文件。
我的存储库很大,因为历史上有一些大文件。为了找到大文件并删除它们,我正在执行:
$ git verify-pack -v .git/objects/pack/pack-..e8a.idx | sort -k 3 -n | tail -3
结果类似于:
12eb660ea206e1b7bd42cb8b525aabe9e86a5064 blob 56413247 15833578 5889838
89b377ace5639c0914bb49d28d0c8e97b0f19a16 blob 56414112 15833631 81736530
4ea83fb57b49f7afdbe99e4f043509d184338f5b blob 56426618 15837504 48628334
为了找到最大文件的路径,我运行:
$ git rev-list --objects --all | grep 4ea83fb57b49f
结果是:
4ea83fb57b49f7afdbe99e4f043509d184338f5b path/to/my/large_file
但是,当我 运行 git log
在这个文件上喜欢:
$ git log --oneline --branches -- path/to/my/large_file
没有显示日志。 此外,每当我尝试通过以下方式从历史记录中删除二进制文件时:
$ git filter-branch --index-filter \
'git rm --ignore-unmatch --cached path/to/my/large_file'
我收到:
WARNING: Ref 'refs/heads/master' is unchanged
有什么想法吗?
可能大对象的路径位于不同的分支。在 filter-branch
命令中使用 --all
从所有分支中删除大文件。