ML.NET 和多对多关系
ML.NET and Many to many relation
我想在我当前的项目中使用 ML.Net Multi-class classification 从我公司的一个系统中收集错误日志。
要点是为错误添加标签,将来要训练一个模型来预测并将标签分配给传入的日志。
我正在使用模型构建器,但看不到我的 table 关系,我将所有日志存储在一个 table 中,标签存储在另一个中,所有关系存储在第三个中。
|Logs| <-- |LogId|TagId| --> |Tags|
我的目标是根据 Logs
table class 将 table 与 TagId
列相匹配 - 这可能吗?还是我必须把所有东西都集中在一个 table?
一般来说,机器学习算法正在处理完整的 'denormalized' 和 'prepared' 数据:每个训练示例都是浮点向量 ('features'),一个 'ground truth'值。
ML.NET 有助于完成一些典型的预处理任务,例如文本特征化、one-hot 编码、rescaling/normalization,但它几乎没有提供任何 'relational'功能(无 JOIN)。
因此,在将数据传递给 ML.NET 之前,您应该对数据进行反规范化/'flatten'。
我想在我当前的项目中使用 ML.Net Multi-class classification 从我公司的一个系统中收集错误日志。
要点是为错误添加标签,将来要训练一个模型来预测并将标签分配给传入的日志。
我正在使用模型构建器,但看不到我的 table 关系,我将所有日志存储在一个 table 中,标签存储在另一个中,所有关系存储在第三个中。
|Logs| <-- |LogId|TagId| --> |Tags|
我的目标是根据 Logs
table class 将 table 与 TagId
列相匹配 - 这可能吗?还是我必须把所有东西都集中在一个 table?
一般来说,机器学习算法正在处理完整的 'denormalized' 和 'prepared' 数据:每个训练示例都是浮点向量 ('features'),一个 'ground truth'值。
ML.NET 有助于完成一些典型的预处理任务,例如文本特征化、one-hot 编码、rescaling/normalization,但它几乎没有提供任何 'relational'功能(无 JOIN)。
因此,在将数据传递给 ML.NET 之前,您应该对数据进行反规范化/'flatten'。