斯坦福 NLP:阿拉伯语词性标签?

Stanford NLP: Arabic Part of Speech labels?

我想知道阿拉伯语词性标注器(2015.1.30版本)为每个词添加的标签的含义。

喜欢 المدرسة/DTNN,我知道它与英文标注器标签不同。

我搜索了他们的网站和文档,但没有找到任何关于 阿拉伯语标准标签

首先,我不确定这个答案;但我希望它能帮助你。 你要的东西,一定在下面的link:POS tag set does the parser use?(可惜有很多坏掉的link!!)。
正如他们提到的,您可以在以下文件 atb1-v4.1-taglist-conversion-to-PennPOS-forrelease.lisp 中找到标签集(您称为标签)。据我了解,他们将一个或多个英文标签序列映射到一个或多个阿拉伯标签。对于 example:the 映射:

(DET+ADJ_COMP+NSUFF_MASC_DU_GEN DT+JJR)

意味着我们将标签的英文序列(DET+ADJ_COMP+NSUFF_MASC_DU_GEN)映射到阿拉伯标签(DT+JJR)。
关于你的问题 (المدرس٩/DTNN),他们提到它由两个标签 (DT + NN) 组成,其中 DT= (الــ)(发音为 'Al')和 NN =(名词、单数或质量)参见 Penn Treebank.

他们使用了称为“POS 列表”的标签列表。

他们所说的“DTNN”是一个决定性名词。例如,当你用英文说“the girl is very beautiful”时,和说“my girl is pretty”是不一样的。

这是 POS 列表: