Tesseract hocr 字符输出
Tesseract hocr character output
我正在使用 Tesseract 便携版 3.02 并希望获得角色的 hocr 输出。问题是 hocr 输出只显示单词的边界框而不是字符,如果有人知道是否有一个选项可以更改 tessdata/config 可以解决问题,请告诉我。否则让我知道是否有另一种方法可以解决这个问题。我无法在计算机上安装任何东西,所以我无法使用 Tesseract API 方法。只能使用dll文件。
我找到了做同样事情的盒子文件,不一定是 html 格式。
我正在使用 Tesseract 便携版 3.02 并希望获得角色的 hocr 输出。问题是 hocr 输出只显示单词的边界框而不是字符,如果有人知道是否有一个选项可以更改 tessdata/config 可以解决问题,请告诉我。否则让我知道是否有另一种方法可以解决这个问题。我无法在计算机上安装任何东西,所以我无法使用 Tesseract API 方法。只能使用dll文件。
我找到了做同样事情的盒子文件,不一定是 html 格式。