拉格朗日对偶性
在求解约束最优化问题中,可以利用拉格朗日对偶性将原始问题转化为对偶问题来解决。
对于原始问题: f(x),ci(x),hj(x) 是定义在 Rn 上的连续可微函数。考虑最优化问题
x∈Rnmins.t.f(x)ci(x)≤0,i=1,2,⋯,khj(x)=0j=1,2,3,⋯,l
这个就是最优化的原始问题,为了解决这个问题,我们引入拉格朗日函数:
L(x,α,β)=f(x)+i=1∑kαici(x)+j=1∑lβjhj(x)
其中 αi≥0
考虑关于 x 的函数 θP(x)=maxα,β:αi≥0L(x,α,β)
对于不符合不等式约束的 x ,取对应的 αi→+∞ 那么 θP的取值就趋于 +∞。同样的,对于不满足等式约束的 x 可以通过对应的 βj 的取值,使 θP 的取值趋于 +∞。
因此可以得到:
θP(x)={f(x)x满足约束条件+∞else
因此原始问题与 minxθP(x) 是等价的
对偶问题
定义:
θD(α,β)=xminL(x,α,β)
L(x,α,β) 关于 α 或 β是一个仿射函数,而 L(x,α,β) 就可以看作一个函数集,而仿射函数集的下确界就是一个凹函数,
问题:
maxs.t.θD(α,β)αi≥0
称之为原始问题的对偶问题,实际上可以转化为一个凸优化问题
对偶问题解的联系
定义原始问题与对偶问题的最优值
p∗=xminθP(x),d∗=α,β:αi≥0maxθD(α,β)
弱对偶性:当二者都存在时 d∗≤p∗
强对偶性:若 x∗,α∗,β∗ 分别是原始问题与对偶问题的可行解且 p∗=d∗时, 那么我们的得到的结果就是最优解
定理:若 f(x) 与 ci(x) 均为凸函数,且 hj(x) 均为仿射函数(即线性的等式约束),那么对偶问题与原始问题的最优值是一致的,并且最优解是等价的。
KKT条件:若 f(x) 与 ci(x) 均为凸函数,且 hj(x) 均为仿射函数(即线性的等式约束),那么 x∗,α∗,β∗ 分别是原始问题与对偶问题最优解的充分必要条件是:
∇xL(x∗,α∗,β∗)=0αi∗ci(x∗)=0ci(x∗)≤0αi∗≥0hj(x∗)=0