第1章 最优化问题的基本概念
§1.1最优化的概念
最优化就是依据最优化原理和方法,在满足相关要求的前提下,以尽可能高的效率求得工程问题最优解决方案的过程。 §1.2最优化问题的数学模型
1.最优化问题的一般形式
?findx1,x2,?,xn?minf(x,x,?,x)?12n ?
s.t.g(x,x,?,x)?0u?1,2,?,pu12n??hv(x1,x2,?,xn)?0v?1,2,?,q? 2.最优化问题的向量表达式
?findX?minf(X)? ?
s.t.G(X)?0??H(X)?0?式中:X?[x1,x2,?,xn]T
G(X)?[g1(X),g2(X),?,gp(X)]T H(X)?[h1(X),h2(X),?,hp(X)]T
3.优化模型的三要素
设计变量、约束条件、目标函数称为优化设计的三要素!
设计空间:由设计变量所确定的空间。设计空间中的每一个点都代表一个设计方案。 §1.3优化问题的分类
按照优化模型中三要素的不同表现形式,优化问题有多种分类方法: 1按照模型中是否存在约束条件,分为约束优化和无约束优化问题 2按照目标函数和约束条件的性质分为线性优化和非线性优化问题 3按照目标函数个数分为单目标优化和多目标优化问题
4按照设计变量的性质不同分为连续变量优化和离散变量优化问题
第2章 最优化问题的数学基础
§2.1 n元函数的可微性与梯度
一、可微与梯度的定义
1.可微的定义
设f(X)是定义在n维空间Rn的子集D上的n元实值函数,且X0?D。若存在n维向量L,对于任意n维向量P,都有
f(X0?P)?f(X0)?LTPlim?0 P?0P则称f(X)在X0处可微。
2.梯度
设有函数F(X),X?[x1,x2,?,xn]T,在其定义域内连续可导。我们把F(X)在定义域内某点X处的所有一阶偏导数构成的列向量,定义为F(X)在点X处的梯度。记为:
??F?F?F?k?F(X)??,,?,?
?x?x?x2n??1T梯度有3个性质:
⑴函数在某点的梯度方向为函数过该点的等值线的法线方向; ⑵函数值沿梯度方向增加最快,沿负梯度方向下降最快; ⑶梯度描述的只是函数某点邻域内的局部信息。 §2.2极小点及其判别条件 一、相关概念
1.极小点与最优解
设f(X)是定义在n维空间Rn的子集D上的n元实值函数,若存在X*?D及实数
??0,使得?X?N(X*,?)?D(X?X*)都有f(X*)?f(X),则称X*为f(X)的局部
极小点;若f(X*)?f(X),则称X*为f(X)的严格局部极小点。
若?X?D,都有f(X*)?f(X),则称X*为f(X)的全局极小点,若f(X*)?f(X),则称X*为f(X)的全局严格极小点。
?findX?minf(X)?对最优化问题?而言
s.t.G(X)?0??H(X)?0? 满足所有约束条件的向量X?[x1,x2,?,xn]T称为上述最优化问题的一个可行解,全体可行解组成的集合称为可行解集。在可行解集中,满足: f(X*)?minf(X)的解称为优化问题的最优解。
2.凸集和凸函数
凸集:设D?Rn,若对所有的X1、X2?D,及??[0,1],都有?X1?(1??)X2?D,则称D为凸集。
凸函数:设f:D?Rn?R1,D是凸集,如果对于所有的X1、X2?D,及??[0,1],都有f[?X1?(1??)X2]??f(X1)?(1??)f(X2),则称f(X)为D上的凸函数。 二、局部极小点的判别条件
驻点:设f(X)是定义在n维空间Rn的子集D上的n元实值函数,X*是D的内点,若?f(X*)?0,则称X*为f(X)的驻点。
局部极小点的判别:设f(X)是定义在n维空间Rn的子集D上的n元实值函数,具有连续的二阶偏导数。若X*是f(X)的驻点,且?2f(X*)是正定矩阵,则X*是f(X)的严格局部极小点。 三、全局极小点的判别 1.凸规划
?minf(X) 对于优化问题:?
s.t.g(X)?0i?1,2,?,pi?若f(X)、gi(X)都是凸函数,则称该优化问题为凸规划。 2.全局极小点的判别
若优化问题为凸规划,则该优化问题的可行集为凸集,其任何局部最优解都是全局最优解。(能否证明)
第3章 无约束优化方法
§3.1下降迭代算法及终止准则 一、数值优化方法的基本思想
?k基本思想就是在设计空间内选定一个初始点X,从该点出发,按照某一方向S(该
k方向的确定原则是使函数值下降)前进一定的步长?k,得到一个使目标函数值有所下降的新设计点Xk?1,然后以该点为新的初始点,重复上面过程,直至得到满足精度要求的最优点X*。
该思想可用下式表示:Xk?1?Xk??kSk 二、迭代计算的终止准则
工程中常用的迭代终止准则有3种:
⑴点距准则
相邻两次迭代点之间的距离充分小时,迭代终止。 数学表达为:Xk?1?Xk?? ⑵函数下降量准则(值差准则)
相邻两次迭代点的函数值之差充分小,迭代终止。 数学表达为:f(Xk?1)?f(Xk)?? ⑶梯度准则
目标函数在迭代点处的梯度模充分小时,迭代终止。 数学表达为:?f(Xk?1)?? 三、算法的收敛速度
对于某一确定的下降算法,其优劣如何评价?人们通常采用收敛速度来评价。 下面给出度量收敛速度的几个概念。 1.P阶收敛
设序列?Xk?收敛于解X*,若存在常数P?0及L、k0,使当k?k0时下式:
Xk?1?X*?LXk?X*
p成立,则称?Xk?为P阶收敛。 2.线性收敛
设序列?Xk?收敛于解X*,若存在常数k0、L及??(0,1),使当k?k0时下式:
Xk?1?X*?L?k
成立,则称?Xk?为线性收敛。 3.超线性收敛
设序列?Xk?收敛于解X*,若任给??0都存在k0?0,使当k?k0时下式:
Xk?1?X*??Xk?X*
成立,则称?Xk?为超线性收敛。 §3.2一维最优化方法 一、确定初始区间的进退法
任选一个初始点x0和初始步长h,由此可确定两点x1?x0和x2?x1?h,通过比较这两点函数值f(x1)、f(x2)的大小,来决定第三点x3的位置。比较这三点函数值是否呈“高——低——高”排列特征,若是则找到了单峰区间,否则向前或后退继续寻求下一点。
进退法依据的基本公式:
x1?x0