预测值不在数据集中

Predict Value Not In Data Set

鉴于我有训练和测试数据，可能缺少逻辑序号。是否可以推断出不存在的值？

例如：训练/测试数据具有为标签指定的值 1,2,3,4,5...7,8,9,10。

是否有可能基于数据模型，它可以预测结果 6，即使在训练或测试数据中没有发生这种情况的实例？

我是机器学习的新手，阅读过有关监督/非监督学习的内容。很难确定一个明确的答案，因为很难找到我不熟悉的领域的正确术语。

最好在数据集中创建包含不存在的标签值的任意行吗？

使用 ML.net.

抱歉，这是一个简单的问题。

谢谢

您的问题是关于确定性方法还是概率性方法？我不明白为什么你应该使用机器学习，但试着阅读马尔可夫链：

在class化问题中，'Label'是'true class'的索引。如果训练数据集中没有属于 class '6' 的示例，则学习模型将永远不会预测 class 6：它被教导永远不要这样做。

在回归问题中，'Label'是'quantity to predict'（实数）。在这种情况下，模型预测它在训练时没有看到的值是非常正常的：模型可能预测 6，或 5.7 或 6.1 等

没有更多细节，我无法判断您是在解决 class化问题还是回归问题。

我解决或实际上减轻价值缺失的方法是执行以下操作。对于每个需要顺序的输入数据类型——没有间隙，我只使用了我的数据集中的数据/行，其中有一个完整的序列，跨越所有条目。

给定以下：0,1,2,3,4,5,6,7,9

我只使用了符合所有条目中最大可用序列的数据。 0 - 7. 这可能会导致训练模型的一些数据丢失，但由于数据相当一致，因此很少有遗漏。