ffi-aspell 中使用的字符 类

Character classes used in ffi-aspell

我正在尝试使用 ffi-aspell gem 对文本进行拼写检查。为了做到这一点,似乎我必须自己提取单词。我试图通过将 String#scan 应用于带有正则表达式的文本来做到这一点,但这似乎并不简单。

定义某些语言的 ffi-aspell 词典中可能出现的 class 个字符的最简单方法是什么?我想让它不仅适用于英语,所以 /[a-zA-Z']/ 字符(或 /[a-zA-Z']+/ 单词)之类的东西不起作用。 /[[:word:]]/ 似乎捕获了字典中没有的字符,例如数字,并且不匹配单词中经常使用的撇号(单引号)。是否有一些文档定义了 ffi-aspell 字典中使用的字符集?

我想先扫描 ffi_aspell 字典 条目,然后再扫描 Regexp#union uniques 会更容易。