大查询线性回归参数

Big Query Linear Regression param

这两点在Big Query中的实际含义是什么。我在第二位得到它,也许,从总基数来看,它实际上意味着不。的特点。第 1 点呢?

  1. 如果训练特征的总基数超过 10,000,则使用 batch_gradient_descent 策略。
  2. 如果有过拟合的问题,就是训练的次数 示例小于 10x,其中 x 是总基数, batch_gradient_descent 使用策略。

基数是特征的可能值的数量。总数是所有特征可能值的总和。

对于 #2,这意味着您必须提供至少比所有特征可能值的总和多 10 倍的输入。这是为了确保每个基数都有足够的示例,从而防止过度拟合。