预测值不在数据集中

Predict Value Not In Data Set

鉴于我有训练和测试数据,可能缺少逻辑序号。是否可以推断出不存在的值?

例如: 训练/测试数据具有为标签指定的值 1,2,3,4,5...7,8,9,10。

是否有可能基于数据模型,它可以预测结果 6,即使在训练或测试数据中没有发生这种情况的实例?

我是机器学习的新手,阅读过有关监督/非监督学习的内容。很难确定一个明确的答案,因为很难找到我不熟悉的领域的正确术语。

最好在数据集中创建包含不存在的标签值的任意行吗?

使用 ML.net.

抱歉,这是一个简单的问题。

谢谢

您的问题是关于确定性方法还是概率性方法?我不明白为什么你应该使用机器学习,但试着阅读马尔可夫链:

https://en.wikipedia.org/wiki/Markov_chain

class化问题中,'Label'是'true class'的索引。如果训练数据集中没有属于 class '6' 的示例,则学习模型将永远不会预测 class 6:它被教导永远不要这样做。

回归问题中,'Label'是'quantity to predict'(实数)。在这种情况下,模型预测它在训练时没有看到的值是非常正常的:模型可能预测 6,或 5.7 或 6.1 等

没有更多细节,我无法判断您是在解决 class化问题还是回归问题。

我解决或实际上减轻价值缺失的方法是执行以下操作。对于每个需要顺序的输入数据类型——没有间隙,我只使用了我的数据集中的数据/行,其中有一个完整的序列,跨越所有条目。

给定以下:0,1,2,3,4,5,6,7,9

我只使用了符合所有条目中最大可用序列的数据。 0 - 7. 这可能会导致训练模型的一些数据丢失,但由于数据相当一致,因此很少有遗漏。