变薄字母的边缘以仅保留字母的中心以进行 OCR

Thinning the edge of a letter to keep only the center of the letter for OCR

我正在尝试提高复杂字母的识别率,例如 Japanese/Chinese 字母。

要让左边的字母变成右边的字母,应该做什么样的图像处理?

想法是保持字母的中心(我不知道怎么称呼它),使字母更清晰,从而提高OCR(如Tesseract)的识别率。

如果有其他方法可以提高这种复杂字母的识别率,也很高兴知道。

您正在寻找 Skeletonization which can be done with morphological operators in OpenCV or Scikit-Image or MATLAB. Another option is a distance transform followed by a threshold as seen in the OpenCV Watershed example