在 openrefine 的句子中聚类单词
clustering word in sentences in openrefine
我想将文本文件中的单词聚集成这样的行:
number queries waiting support representatives become available
query numbers
更具体地说,我想在不改变句子的情况下用它们的集群代表替换单词。
我想做的是:
1. 将我在空格处的列拆分为更多列,每列有一个 1 word/row
2. 聚类所有列
3. 将列合并回来
但这非常乏味。我想听听更简单、也许更优雅的解决方案。
一个可能更好的解决方案是为每一行创建一条记录,"split multivalued cells" 通过 space,聚类,然后通过 space 加入。
示例:
我想将文本文件中的单词聚集成这样的行:
number queries waiting support representatives become available
query numbers
更具体地说,我想在不改变句子的情况下用它们的集群代表替换单词。
我想做的是: 1. 将我在空格处的列拆分为更多列,每列有一个 1 word/row 2. 聚类所有列 3. 将列合并回来
但这非常乏味。我想听听更简单、也许更优雅的解决方案。
一个可能更好的解决方案是为每一行创建一条记录,"split multivalued cells" 通过 space,聚类,然后通过 space 加入。
示例: