未找到密钥:逻辑回归 PredictionIO 中的 regParam

key not found: regParam in Logistic Regression PredictionIO

我正在使用 TextClassificationEnginehttps://docs.prediction.io/demo/textclassification/ 给出的示例有两种用于文本分类的算法(朴素贝叶斯和逻辑回归)。朴素贝叶斯算法工作正常,但当我使用逻辑回归时它给出了一些错误。

{
  "id": "default",
  "description": "Default settings",
  "engineFactory": "org.template.textclassification.TextClassificationEngine",
  "datasource": {
    "params": {
      "appName": "Logistic"
    }
  },
  "preparator": {
    "params": {
      "nGram": 2
    }
  },
  "algorithms": [
    {
      "name": "regParam",
      "params": {
        "regParam":2,5
      }
    }
  ]
} 

以上代码是现场给出的,由于数组原因,在regParam处有一些错误。谁能解释一下 engine.json 中的 regParam 以及逻辑回归的最终 engine.json 是什么?

这是文档中的一个错误,我会提交一个 pull 来修复它。

regParam 期待一个双倍,所以像 "regParam":0.1

具体来说,此参数用于(在 Spark ML 中)L2 正则化, 这通过惩罚过于复杂的模型来减少过度拟合[模型不能很好地泛化]的机会。

要使用的确切值是一个经验问题, 如果您担心对 regParam 的 space 值进行一些搜索的价值,我建议您使用保留的验证集(或 k-fold)来确定获胜者。