关于对偶最优化

我发现,想要了解一个领域的比较快速的方法就是去读本领域近几年的硕士和博士毕业论文(中文的就行)!

 

拉格朗日对偶

今天学习了拉格朗日对偶。我们首先考虑下面这个问题技术文章

    技术文章    

我们记

    技术文章    

(这里如果技术文章是一个向量的话,那么相应的技术文章也是一个向量),则上述最优化问题可以等价于问题技术文章

    技术文章    

于是我们现在似乎可以开始求解问题技术文章了,最通常的求解过程就是先找到技术文章的最优解技术文章,次最优解显然是技术文章的函数,然后将这个最优解技术文章带入问题技术文章继续求技术文章的最优解技术文章,就可以得到问题技术文章的最优解为技术文章但是,通过这种方法来求解其实和直接求解技术文章是一样的(本段结束后举个例子来说明)。于是,我们可以使用一个称为"对偶"的思想来解决这个问题。部分解决。

下面举个例子来说明,假设我们想求解问题:

     技术文章,技术文章是一个方阵 技术文章是一个向量

那么它的等价形式是

    技术文章

我们首先求解max,结果如下:

    技术文章

带入技术文章可得:

    技术文章

这等价于原问题,相当于什么忙都没帮上,还是回到了原点。

 

 

下面我们介绍拉格朗日对偶来处理此问题。我们定义"拉格朗日对偶函数"为:

    技术文章    

相应的"拉格朗日对偶问题"技术文章定义为:

    技术文章    

我们可以立刻得到技术文章技术文章之间的关系,当技术文章技术文章时我们有

    技术文章

上面的第三个不等式是由于技术文章的取值范围从技术文章扩大到了技术文章,大范围内的最小值肯定大于小范围内的最小值。这一点很关键!因为正是由于这个原因,可以把"技术文章必须满足技术文章"这个条件从限制条件中去除掉。这是一个比"技术文章"难处理的条件,去掉它当然有很大的益处。从上式中我们得到:

    技术文章    

于是更进一步,我们有下式:

    技术文章    

而我们一开始就提到技术文章等价于技术文章,那么将技术文章带入便可得到:

    技术文章    

可得:

    技术文章    

我们发现现在所有对自变量的约束仅剩下技术文章,而技术文章这个约束条件不见了,如果我们能使得的等号成立,那么我们就可以得到更好的结果。我们考虑如下可能:如果能够取等,并且关于技术文章的两组最优解(技术文章技术文章)也相等的话,那么我们可以通过交换max和min的求解顺序来求解最初的问题。因为技术文章通常是难解的,所以我们便可以通过这种办法转化为去求解技术文章。假设技术文章,我们将技术文章带入技术文章得打技术文章,再求解技术文章得到技术文章,于是的最优解便是技术文章

补充一下,当然我们也可以通过技术文章然后技术文章的方法来求最优解技术文章,不过这样就相当于直接求解技术文章的等价命题技术文章,上面我已经谈论过这条路是个死胡同了,因此先求max再求min是行不通的,只能先min后max。

 

 

下面引入"鞍点"概念,阐述什么情况下不等号能取等。

鞍点似乎多种定义,大概分为两大类,第一类所定义出的鞍点的意义包括着第二类定义出的。

第一种一般这样定义:

[1]当一个可微函数技术文章的驻点不是极值点时,该驻点也称为技术文章的一个鞍点。伍胜健,《数学分析(第三册)》 ,北京大学出版社,p.96.

[2]A saddle point is a point in the domain of a function that is a stationary point but not a local extremum. Wikipedia page:Saddle point.

第二种一般这样定义:

若存在定义域内的点技术文章使得对定义域内的任意技术文章,都有技术文章,则称点技术文章为函数技术文章的一个鞍点。"鞍点定理在Lagrange乘数法上的应用",大学数学,Vol.25, NO.2, Apr.2009.

 

从下图中我们可以看出,原点显然满足鞍点的第一个定义,但是不满足鞍点的第二种定义,因为在两个坐标轴方向函数值都增加。由于问题的需要,在本文中我们采用第二种鞍点定义方法。这样做可能会使得一些函数得不到求解,如下图中的函数,但这类函数总可以通过坐标变换使得满足第二类鞍点定义。

技术文章

 

我们首先举出一个特例说明形如技术文章技术文章是有可能存在鞍点的。我们取技术文章,取技术文章,在集合技术文章中任取一个作为技术文章,那么可以很容易的验证此技术文章满足技术文章

现在,我们假设技术文章存在鞍点技术文章(此鞍点在定义域技术文章内),那么对任意的技术文章,都有此关系技术文章,所以有:

    技术文章

结合式可得:

    技术文章    

记问题技术文章的最优解为技术文章,结合,并且由于技术文章技术文章的等价性,我们立即可得

    技术文章

带入式得到:

    技术文章    

从第三个不等式我们可以得技术文章,若技术文章存在某个分量技术文章使得技术文章,那么技术文章,这说明在技术文章中至少存在一个分量技术文章。这与技术文章的存在性相矛盾。所以技术文章,进一步可以得到技术文章。于是,我们得到了这个称为"KKT最优化条件"的结果:

    技术文章    

也正是因为这个条件,才使得许多算法拥有稀疏性,比如SVM。因为很多实际问题中向量技术文章的大多数分量都不为零,这使得相对应于这些非零分量的技术文章的分量必须为零,因此技术文章是稀疏的。

将式带入式可得:

    技术文章    

并且通过上一段的推导,我们还得到了技术文章满足问题技术文章的约束条件技术文章,于是我们求得了问题技术文章的一个最优解技术文章

 

另外,今天了解到如何求鞍点已经有许多相当成熟的算法:直接法,预条件Krylov子空间法,MINRES算法,基于Uzawa类型的迭代方法,SOR算法,AOR算法。暂时只只知道他们的名字,还不知道它们长啥样。

 

现在我们还剩下两个问题:技术文章什么时候存在满足定义域限制技术文章的鞍点技术文章呢?如果技术文章不存在鞍点,那又如何求解问题技术文章呢?

 

 

 

关于对偶最优化,布布扣,bubuko.com

文章来自:http://www.cnblogs.com/mashiqi/p/3719101.html
© 2021 jiaocheng.bubufx.com  联系我们
ICP备案:鲁ICP备09046678号-3