EmguCV OCR Tesseract 不同的颜色和大小 - C# 中的深度学习

EmguCV OCR Tesseract different colours and sizes - deep learning in C#

我在 C# 中找到了一个关于车牌识别的例子:

http://www.emgu.com/wiki/index.php/License_Plate_Recognition_in_CSharp#License_Plate_Recognition

EmguCV 和 Tesseract 示例。 示例有效,但在代码中我分配了 VectorOfVectorOfPoint:

CvInvoke.CvtColor(img, gray, ColorConversion.Bgr2Gray);
CvInvoke.Canny(gray, canny, 100, 50, 3, false);

但是我想对彩色报纸上的文本进行 OCR,那里有很多不同颜色的图像和不同大小的字母。我不知道字体的这些颜色和大小以及 x,y 点。 我可以教 OCR 识别这些字母和文本吗?如何动态执行此操作?

根据我过去的经验,给定的 Emgucv 车牌识别示例已经过时而且不是最好的。您使用的是 Tesseract Github 存储库中的默认 tessdata 文件吗? repo 上有针对不同语言的各种不同的 tessdata 文件,对于检测各种字体和颜色的文本非常有帮助。但是,如果您想进一步训练您的数据,请在此处尝试本教程。 https://pretius.com/how-to-prepare-training-files-for-tesseract-ocr-and-improve-characters-recognition/