词相似度的推荐算法
Recommended algorithms for word similarity
我正在研究 algorithms/solutions 实施和解决以下问题的可行性:
根据共同兴趣匹配用户
示例:
U1:滑雪、亚洲文化、冥想、java、加密货币
U2:瑜伽、冥想、管理、美国旅游贴士
U3:编程、旅游、东方美食
我正在考虑基于单词相似度的三个维度:
- 字典同义词
- wordnet 同义词集
- 接近语义相似度(编程 > java、旅行 > 美国旅行小贴士)
- 到目前为止我已经考虑过Levenshtein_distance
- 松散的语义相似性(亚洲文化 >> 东方美食、编程 >> 加密货币、亚洲文化 >> 瑜伽、瑜珈 >> 冥想)
- 完全不确定,玩过word2vec
基于这些方法,我想计算相关性得分并相应地匹配用户。
感谢您的输入!
编辑距离 在我的实验中对于捕获语义相似性不是很有用。
Wordnet 运行良好,但对于大量单词来说速度很慢
Word2Vec 是 wordnet 的良好近似,但在捕获所有相关词方面不够全面
还建议您查看 图嵌入算法 在 Starspace from Facebook 中使用,特别是关于 Facebook 页面点赞和推荐的用例
我正在研究 algorithms/solutions 实施和解决以下问题的可行性: 根据共同兴趣匹配用户
示例:
U1:滑雪、亚洲文化、冥想、java、加密货币
U2:瑜伽、冥想、管理、美国旅游贴士
U3:编程、旅游、东方美食
我正在考虑基于单词相似度的三个维度:
- 字典同义词
- wordnet 同义词集
- 接近语义相似度(编程 > java、旅行 > 美国旅行小贴士)
- 到目前为止我已经考虑过Levenshtein_distance
- 松散的语义相似性(亚洲文化 >> 东方美食、编程 >> 加密货币、亚洲文化 >> 瑜伽、瑜珈 >> 冥想)
- 完全不确定,玩过word2vec
基于这些方法,我想计算相关性得分并相应地匹配用户。
感谢您的输入!
编辑距离 在我的实验中对于捕获语义相似性不是很有用。
Wordnet 运行良好,但对于大量单词来说速度很慢
Word2Vec 是 wordnet 的良好近似,但在捕获所有相关词方面不够全面
还建议您查看 图嵌入算法 在 Starspace from Facebook 中使用,特别是关于 Facebook 页面点赞和推荐的用例