DVC 文件不完整
DVC Files Incomplete
我在一个团队中使用 dvc 和 git 来控制数据文件的版本。我们使用的是 dvc 1.3.1,带有一个 S3 存储桶远程。在同事的分支上执行 dvc fetch
或 dvc pull
时出现此错误:
ERROR: failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']
当我检查 dvc 文件以查找我没有问题的缓存文件时,我看到了:
md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
path: completion_header.p
cache: true
metric: false
persist: false
但是有问题的文件只有这个:
outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
size: 112007
nfiles: 3
path: processed_data
在所有情况下,文件都使用命令 dvc add %dirname%
添加到 dvc。这是我第二次在同事的分支上看到这个(2 个不同的人)。
发帖后,我发现我的同事dvc 了一个目录。我尝试先创建目录,然后调用 dvc fetch
,但得到同样的错误。
In all cases, files are added to dvc with the command dvc add %filename%.
似乎很有可能其中一个 dvc 文件是在较新版本的 dvc 中创建的,而您正在尝试使用较旧版本进行操作。你的同事在添加新文件时是否都使用相同的dvc版本?
我在一个团队中使用 dvc 和 git 来控制数据文件的版本。我们使用的是 dvc 1.3.1,带有一个 S3 存储桶远程。在同事的分支上执行 dvc fetch
或 dvc pull
时出现此错误:
ERROR: failed to fetch data from the cloud - DVC-file 'C:\Users\blah\Documents\repo\data\processed_data.dvc' format error: extra keys not allowed @ data['outs'][0]['size']
当我检查 dvc 文件以查找我没有问题的缓存文件时,我看到了:
md5: ded591aacbe363f0518ceb9c3bc1836b
outs:
- md5: efdab20e8b59903b9523cc188ff727e5
path: completion_header.p
cache: true
metric: false
persist: false
但是有问题的文件只有这个:
outs:
- md5: f4e15187d9a0bbb328e629eabd8d1784.dir
size: 112007
nfiles: 3
path: processed_data
在所有情况下,文件都使用命令 dvc add %dirname%
添加到 dvc。这是我第二次在同事的分支上看到这个(2 个不同的人)。
发帖后,我发现我的同事dvc 了一个目录。我尝试先创建目录,然后调用 dvc fetch
,但得到同样的错误。
In all cases, files are added to dvc with the command dvc add %filename%.
似乎很有可能其中一个 dvc 文件是在较新版本的 dvc 中创建的,而您正在尝试使用较旧版本进行操作。你的同事在添加新文件时是否都使用相同的dvc版本?