图像上的文本检测

Text detection on images

我是机器学习的新学生。我只是想问一下有什么可能的方法来改进方法（例如朴素贝叶斯）以获得更好的结果，将图像分类为文本或非文本图像，而不是仅仅输入 x 数量的图像并告诉系统哪些有文本，哪些有文本不？

提前致谢

此类问题的最新技术是具有多个卷积层的深度神经网络。有关使用深度卷积网络的图像分类示例，请参阅 this article。你的问题（只是确定图像是否有文本）比作者考虑的一般图像分类问题容易得多，所以你可能会使用更简单的网络架构。

现在你不需要自己实现这些东西，有免费的高效和 GPU 加速实现，例如 Caffe, Torch7, keras...