如何在给 Tesseract 之前拼凑图像中的虚线?

How to piece together dashed lines in image before giving to Tesseract?

我的屏幕图像包含一些数字值。我想通过 Tesseract 4.0 识别这些数字。然而,这些数字由虚线组成,例如七段显示器的数字。由于破折号,Tesseract 无法识别这些值。我使用 Gimp 并将这些虚线连接成一条。 Tesseract 几乎可以正确识别值。我想用 OpenCV 做到这一点。如何将数字的虚线连接成一个片段?

before joining process after joining process

根据我使用 Tesseract 的经验,它应该可以轻松识别这些数字而无需任何预处理。
这张图片是否有可能只是放大太多,因此数字太大并且难以识别 Tesseract?我会先尝试使用它,如果它没有帮助,你可以查看 Morphological Transformation in OpenCV