为什么 IPOPT 会在违反约束的情况下评估 objective 函数？

Why does IPOPT evaluate objective function despite breaching constraints?

我在 Julia 中使用 IPOPT。我的 objective 函数会针对某些参数值抛出错误（具体来说，虽然我认为这无关紧要，但它涉及协方差矩阵的 Cholesky 分解，因此要求协方差矩阵是正定的）。因此，我对参数进行非线性约束，使它们不会产生错误。尽管有这个限制，IPOPT 仍然坚持在参数中评估 objective 函数，这导致我的 objective 函数抛出错误。这导致我的脚本崩溃，导致痛苦和痛苦。

我很感兴趣，为什么 IPOPT 通常会在违反约束的参数下评估函数。（我已经确保它确实在评估函数之前检查了约束。）如果可能的话，我想知道如何阻止它这样做。

我已将 IPOPT 的 'bound_relax_factor' 参数设置为零；这没有帮助。我知道我可以让 objective 函数变为 return NaN 而不是抛出错误，但是当我执行 IPOPT 时似乎变得更加混乱并且最终没有收敛。可怜的东西。

如果有帮助，我很乐意提供一些示例代码。

非常感谢:):)

编辑：

一位评论者建议我让我的 objective 函数在违反约束时 return 一个错误的 objective 值。不幸的是，当我这样做时会发生这种情况：

我不确定为什么 Ipopt 会从 2.0016x10^2 的点评估到 10^10 的点评估 — 我担心 IPOPT 有一些非常基本的东西我不理解。

将 'constr_viol_tol' 和 'acceptable_constr_viol_tol' 设置为最小值不会明显影响优化，'over-constraining' 我的参数也不会（即确保它们不会接近不可接受的值）。

Ipopt 保证在所有中间迭代中满足的唯一约束是变量的简单上限和下限。在求解器在最后一次迭代完成收敛之前（如果它可以到达满足终止条件的点），不一定会满足任何其他线性或非线性等式或不等式约束。在存在任意非凸等式和不等式约束的情况下，保证中间迭代始终可行是不容易处理的。牛顿步方向基于局部一阶和二阶导数信息，因此将是一个近似值，如果问题具有非平凡曲率，可能会留下 space 个可行点。以 x * y == constant 点的 space 为例。

您应该重新表述您的问题以避免需要在无效点评估 objective 或约束函数。例如，不是对根据您的数据构造的协方差矩阵进行 Cholesky 分解，而是引入单位下三角矩阵 L 和对角矩阵 D。对所有 i in 1:size(D,1) 和非线性等式约束 L * D * L' == A 施加下限约束 D[i, i] >= 0，其中 A 是您的协方差矩阵。然后在需要对 Cholesky 分解进行运算的任何地方使用 L * sqrtm(D)（这可能是半定分解，因此比经典的严格正定 L * L' 分解更多的是修改后的 Cholesky 表示）。

请注意，如果您的问题是凸的，那么可能有一个专门的公式，圆锥求解器在求解时比像 Ipopt 这样的通用非线性求解器更有效。

为什么 IPOPT 会在违反约束的情况下评估 objective 函数？

Why does IPOPT evaluate objective function despite breaching constraints?

mathematical-optimization

julia

ipopt

non-linear-regression