解析和词性标注之间有什么区别?
What is the difference between parsing and Part Of Speech Tagging?
我知道 POS 标记用其适当的词性标记句子中的每个单词,但这不也是解析器所做的吗?即,将一个句子分解成它的组成部分?
我在网上查过这个,但找不到任何令人满意的解释。
请解开我的疑惑。
提前致谢
它们是两个不同的程序:
词性标记:每个 令牌 都被分配了一个反映其词 class.
的标签
解析:每个 句子 都被分配了一个结构(通常是一棵树),该结构反映了其组成部分如何相互关联。
词性标注采用标记化的单词序列和 returns 注释标记列表,其中每个标记都有一个单词 class 标签。这通常可以通过查看令牌周围的上下文来消除歧义。
还有 chunking,它将标记分组到相关组(例如名词短语)。块是非重叠序列。
解析通常会导致一个句子 parse tree;往往有歧义的句子可以有很多可能的树。
POS 标记通常是解析中的准备步骤,因为解析器通常对词 classes 进行操作(尽管有一些解析算法直接使用标记,或者标记和标记的混合)。
我知道 POS 标记用其适当的词性标记句子中的每个单词,但这不也是解析器所做的吗?即,将一个句子分解成它的组成部分? 我在网上查过这个,但找不到任何令人满意的解释。 请解开我的疑惑。 提前致谢
它们是两个不同的程序:
词性标记:每个 令牌 都被分配了一个反映其词 class.
的标签
解析:每个 句子 都被分配了一个结构(通常是一棵树),该结构反映了其组成部分如何相互关联。
词性标注采用标记化的单词序列和 returns 注释标记列表,其中每个标记都有一个单词 class 标签。这通常可以通过查看令牌周围的上下文来消除歧义。
还有 chunking,它将标记分组到相关组(例如名词短语)。块是非重叠序列。
解析通常会导致一个句子 parse tree;往往有歧义的句子可以有很多可能的树。
POS 标记通常是解析中的准备步骤,因为解析器通常对词 classes 进行操作(尽管有一些解析算法直接使用标记,或者标记和标记的混合)。