c#-tesseract 获取 space 数字识别

c#-tesseract get space recoginition in digits

我是 tesseract 的新手,我正在制作一个 class 项目,我需要在其中扫描数字矩阵。我已经成功地从图像文件中读取数字,但我还没有找到如何识别数字之间的间距。例如,目前我得到 14610 1 4 6 10.

图片:

我目前使用的代码:

Bitmap myBmp = new Bitmap(file);
var image = myBmp;
var ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only 

ocr.Init(@"C:\Users\MuhammadShahroz\Documents\Visual Studio 2013\Projects\ConsoleApplication3\tessdata", "eng", false);
var results = ocr.DoOCR( image, Rectangle.Empty);

foreach (Word word in results)
{
    Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
    mystring = String.Format("{0 } ",word.Text);
}

我认为您需要设置变量 preserve_interword_spaces=1(参见 configuration source