从 C# 中的自由流动字符串中提取名词和形容词的算法

Algorithm to extract Noun and Adjective from a free flowing String in C#

我正在做一个项目,在这个项目中我被困在一个部分,我必须从一个自由流动的文本中找到所有的名词和形容词。我搜索并发现了很少的算法,但在实现时面临很多困难。所以我需要一个 API 或高效的算法来做到这一点..

您需要一种算法来实现所谓的词性 (POS) 标记。通常,这些算法是统计性的,您不能指望完美的性能。其他人试图根据语言语法来解析一个句子,但在现实生活中并不是所有的句子都是语法的。此外,新词(即程序不知道的)词也存在很大问题。例如,您可以完全理解造句 "the moobza klucked a blone" 中的词性,但并非所有算法都能做到。

实用方面,看看斯坦福NLP软件,里面也有a .NET interface。它有一个非常成熟且性能良好的词性标注器。