DVC 文件不完整

DVC Files Incomplete

我在一个团队中使用 dvc 和 git 来控制数据文件的版本。我们使用的是 dvc 1.3.1,带有一个 S3 存储桶远程。在同事的分支上执行 dvc fetchdvc pull 时出现此错误:

ERROR: failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']

当我检查 dvc 文件以查找我没有问题的缓存文件时,我看到了:

md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
  path: completion_header.p
  cache: true
  metric: false
  persist: false

但是有问题的文件只有这个:

outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
  size: 112007
  nfiles: 3
  path: processed_data

在所有情况下,文件都使用命令 dvc add %dirname% 添加到 dvc。这是我第二次在同事的分支上看到这个(2 个不同的人)。

发帖后,我发现我的同事dvc 了一个目录。我尝试先创建目录,然后调用 dvc fetch,但得到同样的错误。

In all cases, files are added to dvc with the command dvc add %filename%.

似乎很有可能其中一个 dvc 文件是在较新版本的 dvc 中创建的,而您正在尝试使用较旧版本进行操作。你的同事在添加新文件时是否都使用相同的dvc版本?