机器学习识别句子中的重要单词

Machine Learning to recognize important words in a sentence

我想使用机器学习从句子中提取与攀岩相关的 names/locations。我已经 "classified" 一堆这样的数据:

Bouldering in Central Park!!||Central Park
Not the best angle but check out that latch!!! Golden Bowl (V7) in Squamish||Golden Bowl||Squamish  
Does anyone have a used crash pad for sale?||

(其中我有一个句子后跟 || 然后是所有 names/locations(再次被 || 分隔)

我正在考虑为此使用 ML.NET,因为我最熟悉 C#,但似乎无法找到如何开始。我认为 Iris classification example 可能最接近我的情况?但我不确定

关于在 ML.NET 中使用什么分类模型有什么建议吗?或者使用不同的 language/framework?

您可以轻松尝试一些预训练的 NER 算法,例如 Stanford 或 Spacy。可能它们对你来说不够用,所以在那一步你需要确定你的实体类型并做一些标记来训练你自己的 NER 算法。

您可以开始查看 Stanford NER and Spacy NER 模块。

编辑:您可以更改分类器类型以获得不同的结果。

斯坦福在线演示工具的示例结果: