图像上的文本检测

Text detection on images

我是机器学习的新学生。我只是想问一下有什么可能的方法来改进方法(例如朴素贝叶斯)以获得更好的结果,将图像分类为文本或非文本图像,而不是仅仅输入 x 数量的图像并告诉系统哪些有文本,哪些有文本不?

提前致谢

此类问题的最新技术是具有多个卷积层的深度神经网络。有关使用深度卷积网络的图像分类示例,请参阅 this article。你的问题(只是确定图像是否有文本)比作者考虑的一般图像分类问题容易得多,所以你可能会使用更简单的网络架构。

现在你不需要自己实现这些东西,有免费的高效和 GPU 加速实现,例如 Caffe, Torch7, keras...