生成 Tesseract 训练数据失败

Failed in generating Tesseract traineddata

我在 Windows 10 上使用 Tesseract v5.0.1.20220118,训练字体只有字母“P”和“Q”。

当我走到台阶的时候

mftraining -F font_properties.txt -U unicharset -O normal.unicharset pq.normal.exp0.tr

未生成pffmtable文件。

当我运行代码cntraining pq.normal.exp0.tr

它告诉我

Reading pq.normal.exp0.tr ...
Clustering ...
N == sizeof(Cluster->Mean):Error:Assert failed:in file ../../../src/classify/cluster.cpp, line 2526

为什么会出错?我该如何解决?

我只生成了 inttempshapetable,但是教程说会有四个文件,包括 shapetableinttemppffmtablenormproto, 不知道是不是字体只有"P"和"Q"两个字母的缘故,不知道怎么解决

请阅读文档:

https://tesseract-ocr.github.io/tessdoc/#training-for-tesseract-5

使用正确的工具:

https://github.com/tesseract-ocr/tesstrain