在 KNIME 中获取标签关联

Getting tag association in KNIME

KNIME 带有多个本地节点,用于执行不同的标记任务,例如 POS 标记或命名实体识别。为了使用已识别的标签或术语,您可以使用 Bag of Words 节点,它会生成 terms(不是单词)和关联的标签。但是,这种方法没有详细说明每个 与哪个标签相关联,也没有详细说明标签(或词)的顺序。

因此,如果你想提取像'POS tags +/- N words with respect to the actual word'这样的特征(例如一个单词window),你怎么能?

例如,对于 'That city was New York',我希望 KNIME 生成一个有序列表,例如: (其中最后一个 NN 将是一个命名实体)。

是的,这是个问题。上周我遇到了同样的情况。

如果你只想通过单词获取 POS,你可以 link 将 Tags to String 节点 到 bag of words 节点的输出,但我认为这种方法失败了对于大型文档,因为同一个词可能会得到不同的 POS(某个词的 POS 值由词的上下文决定),因为词袋节点按文档显示唯一的术语。

现在,为了得到这个 windows ('POS tags +/- N words with respect to the actual word'),我的解决方案是通过命令行(外部工具节点或通过python/java 代码)并在返回的向量中查找每个单词的相应标签。