如何处理 nltk python 中 UnigramTagger 中的拼写错误?
How to handle spelling mistakes in UnigramTagger in nltk python?
我正在使用 python nltk library.I 进行命名实体识别 library.I 正在使用 UnigramTagger
自定义标签 tokens.And 它发生得非常好。
问题是标注器 准确地标注 我在 model.With 中提到的任何拼写错误的单词,它找不到单词。
我该如何解决这个问题?
我喜欢 fuzzywuzzy
允许比率搜索的方式,但不知道是否有任何 nltk 标记器提供相同的功能。需要一些帮助 here.Thanks。
您需要在命名实体识别之前更正拼写。您可以按照 url..
执行此操作
我正在使用 python nltk library.I 进行命名实体识别 library.I 正在使用 UnigramTagger
自定义标签 tokens.And 它发生得非常好。
问题是标注器 准确地标注 我在 model.With 中提到的任何拼写错误的单词,它找不到单词。
我该如何解决这个问题?
我喜欢 fuzzywuzzy
允许比率搜索的方式,但不知道是否有任何 nltk 标记器提供相同的功能。需要一些帮助 here.Thanks。
您需要在命名实体识别之前更正拼写。您可以按照 url..
执行此操作