在 openrefine 的句子中聚类单词

clustering word in sentences in openrefine

我想将文本文件中的单词聚集成这样的行:

number queries waiting support representatives become available
query numbers 

更具体地说,我想在不改变句子的情况下用它们的集群代表替换单词。

我想做的是: 1. 将我在空格处的列拆分为更多列,每列有一个 1 word/row 2. 聚类所有列 3. 将列合并回来

但这非常乏味。我想听听更简单、也许更优雅的解决方案。

一个可能更好的解决方案是为每一行创建一条记录,"split multivalued cells" 通过 space,聚类,然后通过 space 加入。

示例: