Roboflow 在创建数据集版本时删除西里尔标记的对象
Roboflow dropping cyrillic labeled objects when creating dataset version
我有从头开始标记的俄罗斯车牌符号 classification 数据集。标注时,用西里尔字母命名classes没有问题。一切都在“健康检查”选项卡中正确显示。但是,当我尝试创建新版本时,所有名为 classes 的西里尔文对象都被隐式删除。当我含蓄地说时,我的意思是训练集中的实际图像数量少于“训练集”选项卡中规定的数量(4202 实际 vs 7102 规定),与验证和测试相同。
我试过:
- 创建带有扩充的数据集并且只删除“res”虚拟 class 和扩充
- 相同,但将所有西里尔字母重新映射为拉丁字母
- 仅删除 res
不增加
- 不增不减
- 删除所有 classes
结果(增强除外)始终相同。
Actual last image of training set
Stated amount of images in the training set
Roboflow has "dropped" all the 23 classes, but images are still there
Health check tab
我们最终删除了非 ascii 字符。我继续与团队分享这个用户体验,因为它可以在标记过程中解决
我有从头开始标记的俄罗斯车牌符号 classification 数据集。标注时,用西里尔字母命名classes没有问题。一切都在“健康检查”选项卡中正确显示。但是,当我尝试创建新版本时,所有名为 classes 的西里尔文对象都被隐式删除。当我含蓄地说时,我的意思是训练集中的实际图像数量少于“训练集”选项卡中规定的数量(4202 实际 vs 7102 规定),与验证和测试相同。 我试过:
- 创建带有扩充的数据集并且只删除“res”虚拟 class 和扩充
- 相同,但将所有西里尔字母重新映射为拉丁字母
- 仅删除 res 不增加
- 不增不减
- 删除所有 classes
结果(增强除外)始终相同。
Actual last image of training set
Stated amount of images in the training set
Roboflow has "dropped" all the 23 classes, but images are still there
Health check tab
我们最终删除了非 ascii 字符。我继续与团队分享这个用户体验,因为它可以在标记过程中解决