ML .Net 算法用于预测一组短文本与另一组短文本之间的对应关系

ML .Net algorithm to use to predict correspondence between short text from one set to another short text from another set

我有 2 组数据,由短文本标识,它们的名称有一些小的添加。 一个集合中的每个项目在另一个集合中都有另一个相应的项目,根据名称进行一些小的转换。

但是两组中的某些项目之间没有任何 link。但是基于现有的 links,我可以训练一个机器学习模型来预测和建议将 2 个集合中的哪些项目相互关联。

因此,作为输入,它应该从一个集合和一个完整的集合中获取一个项目的名称,并尝试从该集合中找到与提供的项目最匹配的项目。

但我不知道要使用什么算法。也许我可以迭代集合中的每个项目,计算它的名称与参考名称的相似程度,应该使用相似度最高的那个。或许应该按照相似度来排序。

如果能在.Net中使用相似度算法就好了

听起来你的问题需要一个无监督算法。 (我假设您没有标记数据来识别您的集合中的匹配案例)。

也许 K-Means 等聚类算法会有所帮助。这就像你描述的 'similarity' 算法。