当数据几乎从不更改时,Git 存储库中的 BLOB 数据是否如此糟糕?
Is BLOB data in a Git Repo that bad when the data almost never changes?
我已经阅读了很多关于在 GIT 中存储大型二进制文件的缺点。通常有推荐使用git LFS之类的。但大多数注意事项似乎与您将不时更改的文件有关。
将大型二进制文件存储在 GIT 存储库中有什么缺点吗?当文件几乎永远不会更改时?
我说的是一个 3-5 GB 的存储库,其中主要包含旨在用作单元测试输入的图像数据。所以它必须保持不变。
典型的用例是开发人员一次性拉取回购协议,然后几乎不需要再次拉取它。如果他们添加新的单元测试,他们可能会添加更多图像,仅此而已。这就是过去 5 年数据在我们的 SVN 存储库中的存储方式,并且运行良好。如果我将其移至 GIT,是否有一些具体的内容会使这项工作变得更糟?
(我不喜欢这个模型,但它肯定会让我的云构建更容易...)
Git 不是为有效管理大文件而构建的,但无论如何您都可以使用它。通常 要求 使用 LFS 是因为你打算推送到像 github 这样的服务,它们对单个 blob 可以拥有的大小有硬性限制(100 MB) ..... 但如果你自己持有repo,应该没问题
我已经阅读了很多关于在 GIT 中存储大型二进制文件的缺点。通常有推荐使用git LFS之类的。但大多数注意事项似乎与您将不时更改的文件有关。
将大型二进制文件存储在 GIT 存储库中有什么缺点吗?当文件几乎永远不会更改时?
我说的是一个 3-5 GB 的存储库,其中主要包含旨在用作单元测试输入的图像数据。所以它必须保持不变。
典型的用例是开发人员一次性拉取回购协议,然后几乎不需要再次拉取它。如果他们添加新的单元测试,他们可能会添加更多图像,仅此而已。这就是过去 5 年数据在我们的 SVN 存储库中的存储方式,并且运行良好。如果我将其移至 GIT,是否有一些具体的内容会使这项工作变得更糟?
(我不喜欢这个模型,但它肯定会让我的云构建更容易...)
Git 不是为有效管理大文件而构建的,但无论如何您都可以使用它。通常 要求 使用 LFS 是因为你打算推送到像 github 这样的服务,它们对单个 blob 可以拥有的大小有硬性限制(100 MB) ..... 但如果你自己持有repo,应该没问题