训练文本检测系统

Training a Text Detection System

我目前正在使用逻辑回归在给定图像中开发文本检测系统,我需要如下图所示的训练数据:

第一列显示文本的正面示例 (y=1),而第二列显示没有文本的图像 (y=0)。

我想知道在哪里可以获得这种带标签的数据集??

提前致谢。

UC Irvine Machine Learning Repository 是处理这类事情的好起点: http://archive.ics.uci.edu/ml/

但对于与机器学习相关的问题,也可以考虑转向交叉验证:

https://stats.stackexchange.com/

您可以获得类似的数据集here

希望对您有所帮助。