自然语言处理解析树缩写

Natural language processing parse tree abbreviations

我一直在做一个项目,我必须学习使用 NLP 工具。我用 C# 编写它,因此使用 SharpNLP 库(基于 OpenNLP),它还包括一个 WordNet 访问库。我正在使用分块功能进行一些练习,因为我的程序将大量使用它来修改句子中的某些单词而不是其他单词,具体取决于它们在句子中扮演的角色。

chunker 输出带有解析树缩写标签的短语,以及附加到单个单词的短语(这对我的情况来说更重要),但问题是我不知道是什么其中一半是什么意思,我似乎找不到所有缩写词的完整列表;我找到的所有解析树教程都只列出了该解析树上存在的教程。我知道 NP = 名词短语,PP = 介词短语,VP = 动词短语,我认为 DT = 限定词(我曾经看到它缩写为 D)。我知道的还有几个,但我敢肯定还有很多我不知道(JJ、NNS、NN 等)所以我想知道是否有某个地方列出了所有这些列表,如以及理想情况下每个项目的 description/examples。

Microsoft Cognitive Services uses the Penn Tree Bank specification 如果不相同,我认为它非常接近。