ML.NET 多对多分类

ML.NET Classification Many to Many

我需要使用 ML.NET 来处理大块文本并确定任何给定的文本块是否可能属于许多不同类别中的某些类别。

我目前有多个布尔列,当通过 ML.NET 找到任何给定文本块的匹配项时,我想将其标记为真。

我对 ML 完全陌生,当通过样本进行分类时,似乎任何一个文本块都只有 一个 分类。任何人都可以指出一个方向来处理单个文本块的 many 分类吗?也许一些示例代码?

这就是所谓的多分类问题。在我们使用(一个)布尔列的情况下,这是一个二元情况,它可以是是或否、真或假。您需要做的是拥有一个包含多个可能值的 type 列,例如可能是每种类型的文本。一个很好的例子可能是这里的问题分类器:

https://github.com/dotnet/machinelearning-samples/tree/master/samples/csharp/end-to-end-apps/MulticlassClassification-GitHubLabeler

如果您熟悉 Jupyter Notebooks,这是我创建的另一个示例:https://github.com/aslotte/mlnet-jupyter/blob/master/src/DataView/multi-class%20classification.ipynb

希望对您有所帮助!