ML.NET 和多对多关系

ML.NET and Many to many relation

我想在我当前的项目中使用 ML.Net Multi-class classification 从我公司的一个系统中收集错误日志。

要点是为错误添加标签,将来要训练一个模型来预测并将标签分配给传入的日志。

我正在使用模型构建器,但看不到我的 table 关系,我将所有日志存储在一个 table 中,标签存储在另一个中,所有关系存储在第三个中。

|Logs| <-- |LogId|TagId| --> |Tags|

我的目标是根据 Logs table class 将 table 与 TagId 列相匹配 - 这可能吗?还是我必须把所有东西都集中在一个 table?

一般来说,机器学习算法正在处理完整的 'denormalized' 和 'prepared' 数据:每个训练示例都是浮点向量 ('features'),一个 'ground truth'值。

ML.NET 有助于完成一些典型的预处理任务,例如文本特征化、one-hot 编码、rescaling/normalization,但它几乎没有提供任何 'relational'功能(无 JOIN)。

因此,在将数据传递给 ML.NET 之前,您应该对数据进行反规范化/'flatten'。