EmguCV OCR Tesseract 不同的颜色和大小 - C# 中的深度学习

Question

我在 C# 中找到了一个关于车牌识别的例子：

http://www.emgu.com/wiki/index.php/License_Plate_Recognition_in_CSharp#License_Plate_Recognition

EmguCV 和 Tesseract 示例。示例有效，但在代码中我分配了 VectorOfVectorOfPoint:

CvInvoke.CvtColor(img, gray, ColorConversion.Bgr2Gray);
CvInvoke.Canny(gray, canny, 100, 50, 3, false);

但是我想对彩色报纸上的文本进行 OCR，那里有很多不同颜色的图像和不同大小的字母。我不知道字体的这些颜色和大小以及 x,y 点。我可以教 OCR 识别这些字母和文本吗？如何动态执行此操作？

Answer 1

根据我过去的经验，给定的 Emgucv 车牌识别示例已经过时而且不是最好的。您使用的是 Tesseract Github 存储库中的默认 tessdata 文件吗？ repo 上有针对不同语言的各种不同的 tessdata 文件，对于检测各种字体和颜色的文本非常有帮助。但是，如果您想进一步训练您的数据，请在此处尝试本教程。 https://pretius.com/how-to-prepare-training-files-for-tesseract-ocr-and-improve-characters-recognition/

EmguCV OCR Tesseract 不同的颜色和大小 - C# 中的深度学习

EmguCV OCR Tesseract different colours and sizes - deep learning in C#

c#

ocr

tesseract

emgucv

deep-learning