如何更改 Hunspell 词缀文件以允许单词中的数字?
How to change a Hunspell affix file to allow numbers in words?
OCR 程序经常错误地将大写字母 O 识别为零,反之亦然。例如,他们可能会将 Over 识别为 0ver 或 we11。
我尝试添加
REP 0 O
REP 1 l
添加到词缀文件,但它不起作用,因为数字显然被视为单词边界。
(我看过 hunspell man page,但我无法弄清楚需要更改哪些设置才能允许文字中的数字。)
来自联机帮助页:
REP 什么替换
此 table 指定要首先尝试的修改。第一个代表是
此 table 的 header 和一个或多个 REP 数据行是
跟随它。有了这个table,Hunspell 就可以提示正确的
表格为典型的拼写错误时表格不正确
与正确的形式相差超过 1 个字母。搜索
字符串支持正则表达式边界符号(^ 和 $)。例如
一个可能的英语替换 table 定义来处理
拼错的辅音:
REP 5
REP f ph
REP ph f
REP tion$ shun
REP ^cooccurr co-occurr
REP ^alot$ a_lot
你有没有添加第一行,REP + 替换次数?
OCR 程序经常错误地将大写字母 O 识别为零,反之亦然。例如,他们可能会将 Over 识别为 0ver 或 we11。
我尝试添加
REP 0 O
REP 1 l
添加到词缀文件,但它不起作用,因为数字显然被视为单词边界。
(我看过 hunspell man page,但我无法弄清楚需要更改哪些设置才能允许文字中的数字。)
来自联机帮助页:
REP 什么替换 此 table 指定要首先尝试的修改。第一个代表是 此 table 的 header 和一个或多个 REP 数据行是 跟随它。有了这个table,Hunspell 就可以提示正确的 表格为典型的拼写错误时表格不正确 与正确的形式相差超过 1 个字母。搜索 字符串支持正则表达式边界符号(^ 和 $)。例如 一个可能的英语替换 table 定义来处理 拼错的辅音:
REP 5
REP f ph
REP ph f
REP tion$ shun
REP ^cooccurr co-occurr
REP ^alot$ a_lot
你有没有添加第一行,REP + 替换次数?