泰米尔语是否有词性标注器和分词器?

Is there any part of speech tagger and tokenizer of Tamil language?

我是自然语言处理的初学者。我必须研究不同的语言,泰米尔语就是其中之一。我可以向专家询问是否有任何泰米尔语分词器代码(java、c、python 等)和我用于研究的词性标注器代码?

如果能在这里得到一些专家的意见,我将不胜感激。感谢您的帮助。

谢谢

我找到了一种标记化工具 Indic NLP Library。它支持泰米尔语。


我在 Internet 上找不到可用的 POS 标记器工具,但我找到了一些论文:

2008 基于语素的语言模型 用于泰米尔语词性标注

2009 泰米尔语部分的 CRF 模型 标记和分块

2009 基于规则的形态学改进 泰米尔语分析和词性标注 通过投射和归纳技术

也许你可以联系作者寻求帮助。


或者如果你会说泰米尔语,在互联网上(尤其是大学网站)用泰米尔语搜索,你可能会找到一些资源和工具。