大查询线性回归参数

Big Query Linear Regression param

这两点在Big Query中的实际含义是什么。我在第二位得到它，也许，从总基数来看，它实际上意味着不。的特点。第 1 点呢？

如果训练特征的总基数超过 10,000，则使用 batch_gradient_descent 策略。
如果有过拟合的问题，就是训练的次数示例小于 10x，其中 x 是总基数， batch_gradient_descent 使用策略。

基数是特征的可能值的数量。总数是所有特征可能值的总和。

对于 #2，这意味着您必须提供至少比所有特征可能值的总和多 10 倍的输入。这是为了确保每个基数都有足够的示例，从而防止过度拟合。