如何创建用于图像处理的训练数据集

how to create a training dataset for image processing

我有一个包含 10 张 jpeg 高质量航拍图像的数据集,其中包含有关每辆车的边界框(宽度、高度、角度、x 和 y 轴...)的信息的 txt 文件。这是一个例子:

@CATEGORY:GENERAL

@IMAGE:2012-04-26-Muenchen-Tunnel_4K0G0010.JPG

#format: id type center.x center.y size.width size.height angle 

0 30 1319 2338 35 11 56.451578

1 30 1337 2350 42 14 57.817368

2 30 224 3556 61 20 136.967797

我应该如何使用 Caffe 创建车辆数据库以在神经网络中进行训练? 我应该使用 photoshop 裁剪每辆车并一一保存吗?或者可以使用 txt 文件创建不同的 类 车辆以在网络中使用诸如 Matlab?

之类的东西进行训练

有那么多车辆,我不会手工完成。在 python 中,您可以将图像加载到一个 numpy 数组中,然后 select 带有文件中提供的数据的框。您可以通过旋转整个阵列然后 select 盒子来处理角度,就像 select 一个 'normal' 一样。

如果您使用不同的编程语言,您也应该能够遵循这种方法,您只需要将 jpeg 转换为位图并以某种方式将其放入数组中。

我不知道 Caffe,但通常需要捕获准确的边界,因为神经网络需要相同大小的框。