土耳其语版 Tesseract OCR 多维数据集文件

Tesseract OCR cube files for Turkish

在哪里可以找到 cube 模式的 tesseract ocr 土耳其语扩展?

文件:

tr.cube.fold
tr.cube.lm
tr.cube.nn
tr.cube.params
tr.cube.size
tr.cube.word-freq

无处可去。立方体是死胡同,将从 tesseract 中消除,例如见 https://github.com/tesseract-ocr/tesseract/issues/40

包含所有文件,仅此文件就足够了"tur.traineddata"

https://github.com/tesseract-ocr/tessdata/blob/master/tur.traineddata

https://github.com/tesseract-ocr/langdata/tree/master/tur

--

如果您确实需要性能并且愿意损失一些准确性,您也可以使用来自 tessdata_fast 的训练数据。

https://github.com/tesseract-ocr/tessdata_fast/blob/master/tur.traineddata

获取土耳其语版本