变分法及其在最优控制中的应用(1)

上传人：流*** IP属地：江西上传时间：2021-12-26 格式：PPT 页数：97 大小：1.04MB 积分：12 举报 版权申诉

已阅读5页，还剩92页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、一、泛函的定义如果变量J对于某一函数类中的每一个函数x(t)，都有一个与之对应，那么就称变量J为依赖于函数x(t)的泛函，记为：J=Jx(t)。确定的值说明：由于函数的值是由自变量的选取而确定的，而泛函的值是由自变量的函数的选取而确定的，所以将泛函理解为“函数的函数”。例1.1.1 函数的定积分10)( dttxJ是泛函。因为变量J的值是由函数的选取而确定的。例1.1.2 在平面上连接给定两点A(ta，xa)和B(tb，xb)的曲线的弧长J是一个泛函，如图1-1所示。当曲线方程x=x(t)（满足x(ta)= xa ， x(tb)= xb ）给定后，可算出它在A、B两点间的弧长为：A(ta

2、,xa)x(t)B(tb,xb)xot图11dtdtdxJbatt21例1.1.3 函数的不定积分不是泛函。dxyt0)( 泛函的上述概念，可以推广到含有几个函数的泛函的情况，例如：10)()(dttytxJ从例1.1.2可以知道，连接A、B两点的曲线之弧长的泛函，其被积函数是未知函数导数的函数。在一般情况下，被积函数是自变量t，未知函数x(t)及其导数的函数。所以最简单的一类泛函可表示为：求函数的极值时，微分或导数起着重要的作用。求泛函的极值时，变分起着类似的作用。我们将求泛函的极值问题称为变分问题，其相应的方法称为变分法。21x )(tx dtttxtxLtxJftt0),(),(

3、)()()()(0txtxtx（1.1.1）如图1-2所示。二、泛函宗量的变分泛函Jx(t)的宗量是函数x(t)，其变分是指在同一函数类中的两个函数间的差：x(t)xot图12x0(t)x(t)t1t2三、泛函的连续性函数相近当函数x(t)与 x0(t)之差的绝对值，即 x(t)-x0(t) , t1t t2 (1.1.2) 对于x(t)的定义域中的一切t（ t1 t t2 ）都很小时，称函数x(t)与函数x0(t)是相近的，也称为零阶相近。如图1-3所示。x(t)xot图13x0(t)t1t2一阶相近当函数x(t)与 x0(t)之差的绝对值以及它们的一阶导数和之差的绝对值，即 t1

4、 t t2 (1.1.3) 都很小，称函数x(t)与函数x0(t)是一阶相近的，如图1-4所示。)(tx )(0tx )()(, )()(00txtxtxtxx(t)xot图 1 4x0(t)t1t2注意：一阶相近的两个函数，必然是零阶相近，反之不成立。k阶接近当 t1 t t2 (1.1.4) 都很小时，称函数x(t)与函数x0(t)是k阶相近的。函数间距离在不同的函数空间，函数间的距离定义也不同。在函数空间Ca，b（在区间a，b上连续的函数的全体构成的函数空间）中，通常采用下式定义距离：（1.1.5）在函数空间Cka，b（在区间a，b上连续且具有连续的k阶导数的函数的全体构成的函数空

5、间）中，任意两个函数间的距离定义为：（1.1.6）)()(, )()(, )()()(0)(00txtxtxtxtxtxkk)()(max)(),(00txtxtxtxdbta)()(, )()(, )()(max)(),()(0)(000txtxtxtxtxtxtxtxdkkbta显然，式（1.1.5）定量地表示两个函数之间的零阶相近度，而式（1.1.6）定量地表示两个函数之间的k阶相近度。泛函的连续性如果对于任意给定的正数，可以找到这样一个0，当 dx(t)，x0(t) （1.1.7）时，存在 Jx(t)Jx0(t) (1.1.8) 那么，就说泛函J在点x0(t)处是连续的。根据所

6、采用的函数之间距离定义的不同，是按式（1.1.5）还是式（1.1.6），其对应的泛函分别称为零阶连续泛函或k阶连续泛函。四、线性泛函连续泛函如果满足下列条件：（1） Jx1(t)+ x2(t)= Jx1(t)+ Jx2(t) （2） Jcx(t)=c Jx(t)其中，c是任意常数，就称为线性泛函。例如21)()(sin)()(ttdttxtttxtxJ21)()()()()(ttdttxtqtxtptxJ2)()(ttxtxJ都满足上述两个条件，故均为线性泛函。五、泛函的变分如果连续泛函Jx(t)的增量可以表示为：（泰勒级数）)()()()(txJtxtxJtxJ)(),()(),(txt

7、xrtxtxL其中，Lx(t)，x(t)是关于x(t)的线性连续泛函，而rx(t)，x(t)是关于x(t)的高阶无穷小。 Lx(t)，x(t)称为泛函的变分，记为（1.1.9）)(),(txtxLJ（1.1.10）也就是说，泛函的变分是泛函增量的线性主部。当一个泛函具有变分时，即泛函的增量可以用式（1.1.9）来表示时，称该泛函是可微的。例如，泛函dttxtxJ)()(102的增量为：101022)()()(dttxdttxtxJ102)()()(2dttxtxtx10102)()()(2dttxdttxtx于是，其变分为：10)()(2dttxtxJ可以证明，泛函的变分是唯一的。因为，若泛函

8、的变分不是唯一的，则泛函的增量可以写为：)(),()(),()(),()(),(2211txtxrtxtxLtxtxrtxtxLJ)(),()(),()(),(21txtxLtxtxLtxtxL引理1.1.1 泛函Jx(t)的变分为：0)()(txtxJJ证明：如上所述，泛函Jx(t)的增量为：)()()(txJtxtxJJ)(),()(),(txtxrtxtxL其中，（0 1）是一个参变量。由于Lx(t)， x(t)是关于 x(t)的线性连续泛函，根据线性泛函的性质（2），有（1.1.11）)(),()(),(txtxLtxtxL又由于rx(t)， x(t)是关于 x(t)的高阶无穷小，所以

9、0)()()(),(lim)(),(lim00txtxtxtxrtxtxr利用上述两点结论，便得JtxtxJ00lim)()(根据偏微分的定义)()()(lim0txJtxtxJ)(),()(),(lim0txtxrtxtxL)(),(lim)(),(lim00txtxrtxtxL)(),(lim0txtxL)(),(txtxL因为泛函Jx(t)的变分为：)(),(txtxLJ所以0)()(txtxJJQED0)()(txtxJJ0102)()(dttxtxdttxtx0102)()(dttxtxtx010)()()(210)()(2dttxtx例1.1.4 求泛函的变分。102)( dtt

10、x根据式（1.1.11），该泛函的变分为：0)()(txtxJJ例1.1.5 求泛函的变分 fttdtttxtxLJ0),(),(根据式（1.1.11），所求泛函的变分为：00),()(),()(fttdtttxtxtxtxLdtttxtxtxtxLftt00),()(),()(dttxtxtxttxtxtxtxLtxtxtxttxtxtxtxLftt0)()()(),()(),()()()()(),()(),()(0fttdttxtxttxtxLtxtxttxtxL0)()(),(),()()(),(),(若设 222)()(),(),(ttxtxttxtxL则dttxtxtxtxJftt

11、0)()()()(2六、泛函的极值如果泛函Jx(t)在函数空间中点x=x0(t)的邻域内，其增量为：0)()(0txJtxJJ就称泛函Jx(t)在点x0(t)处达到极小值；如果泛函Jx(t)在函数空间中点x=x0(t)的邻域内，其增量为：0)()(0txJtxJJ就称泛函Jx(t)在点x0(t)处达到极大值； x0(t)的邻域包含满足条件：的所有点x(t)的球（即以x0(t) 为圆心，以为半径的球）。)(),(0txtxd) )()(max)(),(00txtxtxtxdbta)()(0txtx注意：所采用的函数间的距离的定义的不同，点 x0(t)的邻域内所包含的函数也不同。若强极值若)

12、 )()(, )()(max)(),(000txtxtxtxtxtxdbta)()()()(00txtxtxtx弱极值显然，如果泛函Jx(t)在点x0(t)处达到强极值，那么它在点x0(t)处也一定达到弱极值。反之不成立。定理1.1.1（必要条件）（必要条件）若泛函Jx(t)是连续可微的，并且在点x0(t)处达到极值，则泛函在点x0(t)处的变分等于零，即0)(),(0txtxJ（1.1.12）证明：对于任意给定的x(t)，Jx0(t)+ x(t)既是函数x(t)的泛函，又是变量的函数。泛函Jx0(t)+ x(t)在x0(t)处达到极值，也可看成是函数Jx0(t)+ x(t)在 =0处

13、达到极值，所以函数Jx0(t)+ x(t)对变量的偏导数在 =0处应等于零，即0)()(00txtxJ而由式（1.1.11）有000)()()(),(txtxJtxtxJ比较上面两式，又考虑x(t)是任意给定的，所以，0)(),(0txtxJQED 从定理1.1.1的推证中可见，泛函达到强极值与弱极值的必要条件是相同的。应当指出：本节所讨论的定义、引理和定理，稍加变动就可以应用于含有多个未知函数的泛函：Jx1(t)， x2(t)， xn(t)拉格朗日（Lagrange）问题基本问题 (1.2.1)麦耶耳(Mayer)问题 (1.2.2)波尔扎（Bolza）问题 (1.2.3) 最优控制问题中，

14、根据性能指标的类型（积分型性能指标、终值型性能指标、复合型性能指标）的不同，分别对应了古典变分法中的三类基本问题。fttdtttxtxLtxJ0),(),()(),()(ffttxtxJfttffdtttxtxLttxtxJ0),(),(),()(固定端点的Lagrange问题问题描述：假定点A(t0,x0)和B(tf,xf)是所要寻求的泛函（1.2.1）的极值曲线x(t)的两个固定端点，如图1-5所示，其坐标为：ffxtxxtx)()(00（1.2.4）现在的问题是：从满足边界条件（1.2.4）的二阶可微的函数中，选择使泛函（1.2.1）达到极小值的函数x(t)。解：设x*(t)是使泛函

15、（1.2.1）达到极小值且满足边界条件（1.2.4）的极值条件。现用)()(*)(txtxtx表示满足边界条件（1.2.4）的极值曲线x*(t)的邻域曲线。其中（1.2.5）x(t)是泛函宗量x(t)的变分，(01)是一参变量。为使x(t)是满足边界条件（1.2.4）的极值曲线x*(t)的邻域曲线， x(t)应具有连续导数且满足条件： x(t0)= x(tf)=0 (1.2.6)于是，由式（1.2.5）得到)()(*)(txtxtx（1.2.7）由于x*(t)是极值曲线，所以泛函（1.2.1）在极值曲线x*(t)上的变分等于零（定理1.1.1），即0J由引理1.1.1知，泛函的变分为0)()

16、(*txtxJJ（1.2.8）（1.2.9）将式（1.2.1）代入式（1.2.9），得0)()(*txtxJJ00),()(*),()(*fttdtttxtxtxtxLdtttxtxtxtxLftt00),()(*),()(*fttdttxtxttxtxLtxtxttxtxL0)()(),(*),(*)()(),(*),(*xLxLfttxxdttxLtxL0)()(1.2.10) 对式（1.2.10）右端第二项进行分部积分dttxLdtdtxLdttxLxttttxttxfff)()()()(000（1.2.12）将式（1.2.11）代入式（1.2.10），并考虑式（1.2.8）得ffttt

17、txxxtxLdttxLdtdL000)()()(利用条件（1.2.6），则上式变为（1.2.13）fttxxdttxLdtdL00)()(（1.2.11）考虑到泛函宗量的变分x(t)是任意的函数，不妨选择xxLdtdLtwtx)()(（1.2.14）其中w(t)是任一满足下列条件的函数：)(, 0)(020为某一函数ctttctttttwff将式（1.2.14）代入式（1.2.13），可得0)(20dtLdtdLtwfttxx由上式可见，一个非负的函数的定积分为零，只能是被积函数恒等于零，因此有0 xxLdtdL（1.2.15）将上式左端第二项展开，可得0 xxxxt xxLxLxLL （1

18、.2.16）欧拉(Euler)方程欧拉方程式中2222,xLLxxLLxtLLxxxxt x 若时，欧拉方程是一个二阶微分方程。0 xxL 定理1.2.1 若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf，则泛函fttdtttxtxLtxJ0),(),()(达到极值的必要条件是，曲线x(t)满足欧拉方程0 xxLdtdL其中x(t)应有连续的二阶导数，则至少应是二次连续可微的。),(),(ttxtxL几种特殊的欧拉方程（可以得到封闭形式的解）被积函数L不依赖于，即被积函数L不依赖于x，即被积函数L不依赖于t，即在这种情况下，欧拉方程的首次积分为（1.2.17）其

19、中c是待定的积分常数。实际上，将上式左边对t求全导数，有被积函数L 线性地依赖于，即 x ),(txLL ),(txLL),(xxLLcLxLx2()xxxxxxdLxLxLx LxxLdt0)(xxxxxLxLxLx 式（1.2.16）cLxLxx xtxtxL),(),( 对于向量空间的泛函，也存在着欧拉方程，不过是欧拉方程组（即向量欧拉方程）。定理1.2.2 在n维函数空间中，若极值曲线X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T和终端X(tf)=x1(tf),x2(tf),xn(tf)T是给定的，则泛函fttdtttXtX

20、LtXJ0),(),()(达到极值的必要条件是曲线X(t)满足向量欧拉方程0XXLdtdL其中X(t)应有连续的二阶导数，而则至少应是二次连续可微的。),(),(ttXtXL（1.2.18）例1.2.1 求泛函满足边界条件的极值函数。2022212121)2()(),(dtxxxxtxtxJ1)2(, 0)0(, 1)2(, 0)0(2211xxxx解：由式（1.2.18）得：0022211211xxxxLdtdLxx 0022122122xxxxLdtdLxx )4(11xx 其特征方程为：014s特征根为：js, 1从而得tctcececxtctcececxttttcossincos

21、sin4321243211由给定的边界条件得1, 03421cccc于是得极值函数：ttxttxsin)(sin)(*2*1可以利用MATLAB符号工具箱求解，求解过程如下： syms x1 x2；s=dsolve(D2x1-x2=0,D2x2-x1=0,x1(0)=0,x1(pi/2)=1,x2(0)=0, x2(pi/2)=-1,t)；x1=s.x1x2=s.x2运行结果如下:x1 =sin(t)x1 =-sin(t)例1.2.2 最速降线(又称捷线)问题所谓最速降线问题是:设在竖直平面内有两点A和B，它们不在同一条铅垂线上，现有一质点受重力的作用自较高的A点向较低的B点滑动，如果不考虑

22、各种阻力的影响，问应取怎样的路径，才能使所经历的时间最短？解：在A、B两点所在的竖直平面内选择一坐标系，如图16所示。 A点为坐标原点，水平线为x轴，铅垂线为y轴。设质点的初速度为零，则由力学的知识可知，质点在重力的作用下，不考虑各种阻力的影响，从A点向B点下滑的速度的大小为gydtdl2（1.2.19）xoyA(0,0)B(xf,yf)dxdydl图16由图16得dxydydxdl2221)()(（1.2.20）将式（1.2.20)代入式（1.2.19）中，并变换，得dxgyydt212对上式两边进行积分，可得质点自点A(0，0)滑动到点B(xf，yf)所需的时间为dxgyyxytfx0

23、221)(（1.2.21）设y=y(x)是连接点A(0，0)和点B(xf，yf)的任一光滑曲线,则最速降线问题的数学提法是:在XOY平面上确定一条满足边界条件ffyxyy)(, 0)0(（1.2.22）的极值曲线y=y(x)，使泛函dxgyyxyJfx0221)(（1.2.23）达到极小值。这时被积函数为：gyyL212不显含自变量x，由(1.2.17)知，它的首次积分为cygyygyyLyLy)1 (221222化简上式得212121,1gccycy这种方程宜于利用参数法求解，为此，令ctgy 于是，)2cos1 (2sin112121ccctgcy又由dcdcctgdcydydx)2co

24、s1 (sin2cossin21211对上式积分，得2121)2sin2(2)22sin(ccccx由边界条件y(0)知，c2=0，于是)2cos1 (2)2sin2(211cycx令2,211cr最后得)cos1 ()sin(ryrx 这是圆滚线的参数方程。式中r是滚动圆半径，其值由另一边界条件y(xf)=yf确定。所以，最速降线是一条圆滚线。当极值曲线x*(t)的端点变化时，要使泛函达到极小值， x*(t)首先应当满足欧拉方程：fttttxtxLtxJ0),(),()(0 xxLdtdL若端点固定,可以利用端点条件:ffxtxxtx)()(00确定欧拉方程中的两个待定的积分常数。问题：若

25、端点可变，如何确定这两个积分常数？横截条件推导过程问题描述：假定极值曲线的始端A(t0，x0)是固定的，而终端B(tf，xf)是可变的，并沿着给定的曲线)()(ffttx（1.3.1）变动，如图17所示。现在的问题是需要确定一条从给定的点A(t0，x0)到给定的曲线(1.3.1)上的某一点B(tf，xf)的连续可微的曲线x(t) ，使得泛函fttttxtxLtxJ0),(),()(达到极小值。（1.3.2）txA(t0,x0)B(t*f,x*f)x*(t)x(t)(ft图17解：设x*(t)是泛函（1.3.2）的极值曲线。 x*(t)的邻域曲线可表示为：)()(*)()()(*)(txtxtx

26、txtxtx（1.3.3）（1.3.4）由图1-7可见，每一条邻域曲线x(t)都对应一个终端时刻tf ，设极值曲线x*(t)所对应的终端时刻为tf *，则邻域曲线x(t)所对应的终端时刻tf可以表示为：fffdttt*（1.3.5）将式（1.3.3）（1.3.5）代入式（1.3.2），得ffdtttdtttxtxtxtxLJ*0),()(),()(*0),()(),()(*fttdtttxtxtxtxLfffdtttdtttxtxtxtxL*),()(),()(*（1.3.6）根据泛函达到极值的必要条件0)()(0txtxJJ则有：0*0),()(),()(fttdtttxtxtxtxL0),

27、()(),()(0*fffdtttdtttxtxtxtxL（1.3.7）式（1.3.7）左边第一项相当于tf固定时的泛函的变分，按照上一节推导的结果可得0*0),()(),()(fttdtttxtxtxtxL*0*0)()()(ffttttxxxtxLdttxLdtdL（1.3.8）式（1.3.7）左边第二项先利用中值定理，然后求导，则得fttdtttdtttxtxLdtttxtxtxtxLffff*),(),(),()(),()(*0*（1.3.9）将式（1.3.8）和式（1.3.9）代入式（1.3.7），得0),(),()()()(*0*0*fttttttxxxdtttxtxLtxLdtt

28、xLdtdLfff考虑到欧拉方程和始端固定0)(, 00txLdtdLxx所以0),(),()(*fttfttxdtttxtxLtxLff（1.3.10）若x(t*f)与dtf互不相关，则由上式得00ffttttxLL（1.3.11）但是，终端点沿曲线（1.3.1）变动，所以x(t*f)与dtf相关。为了进一步简化式（1.3.10），应当求出x(t*f)与dtf之间的关系。根据终端约束条件（1.3.1），应有)()()(*ffffffdttdttxdttx将上式对取偏导数，并令=0，利用式（1.3.4），整理得fffffffffdttxttxdtttxdttx)()()()()()(*将上式

29、代入式（1.3.10），可得0)(*fttxdtLxLf由于dtf是任意的，所以0)(*fttxLxL（1.3.12）横截条件定理1.3.1 若曲线x(t)由一给定的点(t0，x0)到给定的曲线x(tf)=(tf)上的某一点(tf，xf)，则泛函fttttxtxLtxJ0),(),()(达到极值的必要条件是， x(t)满足欧拉方程0 xxLdtdL和横截条件0)(*fttxLxL其中x(t)应有连续的二阶导数，则至少应是二次连续可微的，而(t) 则应有连续的一阶导数。),(),(ttxtxL若极值曲线的始端不是固定的，并沿着曲线)()(00ttx(1.3.13)变动，则同样可以推导出始端的横

30、截条件0)(*0ttxLxL(1.3.14) 根据定理1.3.1和式（1.3.14），可得到端点可变时，Lagrange问题的解，除有欧拉方程外，还有横截条件：(1)始端、终端可变，即x(t0)=(t0)， x(tf)=(tf)，则横截条件为：0)(*0ttxLxL0)(*fttxLxL(2) 当t0、 tf 可变，而x(t0) 与x(tf)固定时，则横截条件为：*00,t tL*0ft tL(3)当t0、 tf 固定，而x(t0) 与x(tf)可变时，即始端与终端分别在t=t0、t=tf上滑动，则横截条件为：0*0ttxL0*fttxL定理1.3.1和以上几种情况的横截条件，都可以将其推广到

31、n维函数向量X(t)=x1(t),x2(t),xn(t)T的泛函的情形。定理1.3.2 在n维函数空间中，若曲线X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T是固定的，而终端X(tf)=x1(tf), x2(tf), xn(tf)T是可变的，且在曲面X(tf)=(tf)上变动，则泛函fttdtttXtXLtXJ0),(),()(达到极值的必要条件是，曲线X(t)满足向量欧拉方程0XXLdtdL其中X(t)应有连续的二阶导数，而则至少应是二次连续可微的，而(t)=1(t)， 2(t)， n(t)T则应有连续的一阶导数。),(),(tt

32、XtXL和横截条件0)(*fttXTLXL 若曲线X(t)=x1(t),x2(t),xn(t)T的始端不是固定的，而是可变的，并在给定的曲面)()(00ttX上变动，其中，则同样可以推导出始端的横截条件为： Tntttt)(,),(),()(0020100)(*0ttXLXL例1.3.1 求t-x平面上由给定A(0,1)至给定直线x=2t的弧长最短的曲线方程。o1212txA(0,1)dsx*(t)图18解：由图18，弧长dtxdxdtds2221)()(根据题意，目标泛函应选为：dtxJft021这是一个始端固定，终端可变的泛函的变分问题。由于泛函的被积函数中不显含x(t)，所以Eule

33、r方程为：21xL2112221101ctcxcccxcxxxxdtd由初始条件x(0)=1，得c2=1，从而有11tcx由横截条件（1.3.12），得01)1(122xxxx经整理得，所以c1=1。最优轨线方程为：1x 1)(* ttx最优轨线与给定直线垂直。泛函二阶变分推导过程：给定泛函为其一阶变分为fttdtttxtxLtxJ0),(),()(0),()(),()(ttxtxtxtxJJdttxtxttxtxLtxtxttxtxLdtttxtxtxtxLdtttxtxtxtxLffftttttt000)()(),(),()()(),(),(),()(),()(),()(),()(00

34、（1.4.1）（1.4.2）而二阶变分为)(2JJdttxtxttxtxtxtxLtxtxttxtxtxtxLdttxtxttxtxtxtxLtxtxttxtxtxtxLttxtxtxtxJfftttt000)()(),()(),()()()(),()(),()()()(),()(),()()()(),()(),()(),()(),()(00dttxtxtxttxtxLtxtxttxtxLtxtxttxtxLtxttxtxLtxtxdttxtxttxtxLtxtxtxtxttxtxLtxtxttxtxLfftttt)()()(),(),()()(),(),()()(),(),()(),(),(

35、 )()()()(),(),()()()()(),(),(2)()(),(),(222222222222200（1.4.3）于是，为使泛函（1.4.1）在曲线x(t)上达到极小（或极大）值，其一阶变分（1.4.2）应为零，而其二阶变分（1.4.3）必须为正（或负）。由此，得到下面的定理。定理1.4.1 若泛函fttdtttxtxLtxJ0),(),()(的一阶变分0J则Jx(t)达到极小值的充分条件是二阶型矩阵)(),(),()()(),(),()()(),(),()(),(),(222222txttxtxLtxtxttxtxLtxtxttxtxLtxttxtxL（1.4.4）是正定的或半正

36、定的；而Jx(t)达到极大值的充分条件是式（1.4.4）是负定的或半负定的。定理1.4.1可以推广到含有n个未知函数的泛函的情形。一、回顾等式约束条件下函数极值问题的解法设有函数),(yxfZ （1.5.2）现在需要求函数Z在约束条件为0),(yxg（1.5.1）情况下的极值。（1）消元法：从约束条件（1.5.2）中将y解出来。用x表示y，即 y=y(x)然后将y(x)代入f(x,y)中，得到 Z=fx, y(x) （1.5.3）这样，函数Z就只含有一个自变量x了，在等式（1.5.2）约束条件下的函数(1.5.1)的极值问题，就变成无约束条件的函数（1.5.3）的极值问题了。但是，消元法存

37、在两个问题：从方程（1.5.2）中将y解出来往往是很困难的；对x和y这两个自变量未能平等看待。（2）拉格朗日乘子法（Lagrange factor）步骤如下：作一个辅助函数 F=f(x,y)+g(x,y) 式中，是待定的常数，称为拉格朗日乘子；求辅助函数F的无条件极值，即令0, 0yFxF(1.5.4) 联立求解方程（1.5.2）和（1.5.4），求出驻点（ x0 ，y 0）和待定常数值; 判断（ x0 ，y 0）是否是函数f(x,y)的极值点。拉格朗日乘子法对于求n元函数 y=f（x1，x2，xn）在多个约束方程 gi（x1，x2，xn） =0，i=1，2，，m； m n条件下的

38、极值问题，同样适用。二、等式约束条件下泛函极值问题的解法求泛函fttdtttXtXLJ0),(),(（1.5.5）在约束方程为, 0),(),(0ftttttXtXf（1.5.6）和端点条件为ffXtXXtX)()(00（1.5.7）利用拉格朗日乘子法求解上述等式约束条件下的泛函极值问题，其具体步骤为构造辅助泛函其中(t)= 1(t), 2(t), m (t)T是m维待定向量乘子。于是，就将有约束条件（1.5.6）的泛函（1.5.5）的极值问题转化成无约束条件的泛函（1.5.8）的极值问题。令 (1.5.9) 写出向量形式的欧拉方程（1.5.10）情况下的极值曲线。这里 X(t)=x1

39、(t),x2(t),xn(t)T， f=f1,f2,fmT，m n。而是x1(t),x2(t),xn(t)和t的标量函数。),(),(ttXtXLdtttXtXftttXtXLJfttT0),(),()(),(),(0（1.5.8）),(),()(),(),(ttXtXftttXtXLFT0XXFdtdF联立求解欧拉方程（1.5.10）和约束方程（1.5.6），可以得到n维向量函数X(t)和m维向量乘子 (t)。利用端点条件（1.5.7）确定欧拉方程解中的2n个积分常数，得到候选函数X(t)。检验候选函数X(t)是否使泛函（1.5.8）达到极值以及是极大值还是极小值。说明：利用拉格朗日乘子

40、法求得的函数X(t)，如果（1.5.8）达到极值，就一定是原泛函（1.5.5）的极值函数。因为由约束方程（1.5.6）和欧拉方程（1.5.10）联立解出的向量函数X(t)和(t)一定满足约束方程（1.5.6），所以必有J0=J，另外，当将所解出的(t)代入辅助泛函（1.5.8）时，函数X(t)将使辅助泛函（1.5.8）达到无条件极值，因为函数X(t)是辅助泛函（1.5.8）的欧拉方程（1.5.10）的解。上面的论述仅仅指出了利用拉格朗日乘子法求出的辅助泛函（1.5.8）的无条件的极值函数，一定是原泛函（1.5.5）在等式（1.5.6）约束条件下的极值函数。但是，却没有说明原泛函（1.5.5）

41、在等式（1.5.6）约束条件下的所有极值函数是否都能利用拉格朗日乘子法求出来？下面的定理将回答这个问题。定理1.5.1 如果n维向量函数 X(t)=x1(t),x2(t),xn(t)T （1.5.11）能使泛函fttdtttXtXLJ0),(),(（1.5.15）在等式约束, 0),(),(0ftttttXtXf（1.5.12）条件下达到极值，这里f是m维向量函数， m n，必存在适当的m维向量函数 (t)= 1(t), 2(t), m (t)T （1.5.14）使泛函dtttXtXftttXtXLJfttT0),(),()(),(),(0（1.5.13）达到无条件极值。即函数X(t)是泛函（

42、1.5.15）的欧拉方程0XXFdtdF的解，其中（1.5.16）( ),( ), ( ) ( ),( ), TFL X tX t tt f X tX t t而X(t)和(t)由欧拉方程（1.5.16）和约束方程（1.5.13）共同确定。说明：定理1.5.1表明，泛函（1.5.12）在等式（1.5.13）约束条件下的极值函数X(t) ，同时也使泛函（1.5.15）达到无条件极值。这就进一步说明泛函（1.5.12）在等式（1.5.13）约束条件下的极值函数X(t) 都可通过拉格朗日乘子法求得。如果不仅将X(t) ，而且连函数(t)在内，都看成是泛函（1.5.15）的宗量，那么，约束方程（1.

43、5.13）也可以看成是泛函（1.5.15）的欧拉方程。方程（1.5.13）和（1.5.16）共有n+m个方程，恰好可以解出n维和m维未知函数X(t) 和(t)。当约束方程中（1.5.13）中的函数f不包括有 X(t)的导数时，则式（1.5.13）便成为一种代数方程约束。定理1.5.1仍然成立。例1.5.1 已知受控系统的动态结构如图19所示。求最优控制u*(t)，使目标泛函202)(21dttxJ 取极小值。给定的边界条件为0)2(, 1)0(, 0)2(, 1)0(xxxxx(t)u(t)21s图19 双积分对象解：令)()(),()(21txtxtxtx则得系统的状态方程为：)()()

44、()(221tutxtxtx现在的目标泛函为202)(21dttuJ应用拉格朗日乘子法，构造辅助泛函（1.5.17）202122120)()()()()()()(21dttxtutxtxtttuJ令)()()()()()()(21221212txtuttxtxttuF则向量形式的欧拉方程为111)(0)(11cttFdtdFxx21221)(0)()(22ctctttFdtdFxx212)(0)()(ctctuttuFdtdFuu根据状态方程（1.5.17），得3221221221ctctcxctcx4322311212161ctctctcxxx利用边界条件，可得1, 1,27, 34321c

45、ccc所以，最优控制273)(* ttu 对于最优控制问题来说，当状态变量和控制变量均不受约束，即 X(t)Rn，U(t) Rm时，是个在等式约束条件下求泛函极值的变分问题，因此，可以利用在上一节中介绍的拉格朗日乘子法来求解。在这一节中，利用拉格朗日乘子法求解最优控制问题时，将引入哈密顿（Hamilton）函数，推导出几种典型的最优控制问题应满足的必要条件。1.6.1 拉格朗日问题的解问题1.6.1 给定系统状态方程),(),()(ttUtXftX(1.6.2)初始条件00)(XtX(1.6.1)终端条件：tf固定，X(tf)自由和性能泛函fttdtttUtXLJ0),(),(1.6.3)要求

46、从容许控制U(t) Rm中确定最优控制U*(t)，使系统（1.6.1）从给定的初态X(t0)转移到某个终态X(tf) ，并使性能泛函（1.6.3）达到极小值。这是拉格朗日问题，又称为积分型最优控制问题。解：将状态方程（1.6.1）改写为0)(),(),(tXttUtXf(1.6.4)于是，上述最优控制问题就变成为在微分方程（1.6.4）约束条件下求泛函（1.6.3）极值的变分问题。利用拉格朗日乘子法，引入n维拉格朗日乘子向量 (t)= 1(t), 2(t), n (t)T (t)称为协态变量，以便与状态变量相对应。构造辅助泛函fttTdttXttUtXftttUtXLJ0)(),(),()

47、(),(),(0(1.6.5)dtttUttXtXFftt0),(),(),(),(其中，)(),(),()(),(),(),(),(),(),(tXttUtXftttUtXLttUttXtXFT(1.6.6)于是，求泛函（1.6.3）在等式（1.6.1）约束条件下的极值问题，就转变成为求泛函（1.6.5）的无约束条件的极值问题。定义哈密顿（Hamilton）函数为),(),()(),(),(),(),(),(),(ttUtXftttUtXLttUttXtXHT(1.6.7)它是一标量函数，则式（1.6.6）变为)()(),(),(),(),(),(),(),(tXtttUttXHttUttX

48、tXFT)()(),(),(),(ttXttUttXHT 利用变分法可以写出辅助泛函（1.6.5）的欧拉方程(1.6.8)000UFdtdUFFdtdFXFdtdXF将式（1.6.8）代入上式，得0),(),()()(UHttUtXfHtXXHt（1.6.11）（1.6.10）（1.6.9）协态方程（或共轭方程）状态方程规范方程（或正则方程）控制方程（1.6.12）初始状态为00)(XtX由于终端时刻tf固定，终端状态X(tf)自由，所以横截条件为 0fttXF考虑式（1.6.8），得0)(ft（1.6.13）式（1.6.9）（1.6.13）就是式（1.6.1）（1.6.3）所给定的最优控

49、制问题的解应满足的必要条件。这些条件也可以由求辅助泛函J0对状态变量X(t)和控制变量U(t)的变分中推导出来。联立求解规范方程（1.6.9）和（1.6.10）可以得到两个未知函数X(t)和 (t)，其一个边界在始端（1.6.12），另一个边界在终端（1.6.13），故称为混合边界问题或两点边界值问题。求解两点边界值问题步骤由控制方程（1.6.11）求得 U=UX(t)，(t)，t （1.6.14）将式（1.6.14）代入规范方程（1.6.9）和（1.6.10）消去其中的U(t)，得到（1.6.15）（1.6.16）利用边界条件（1.6.12）和（1.6.13）联立求解方程（1.6.1

50、5）和（1.6.16），可得唯一确定的解X(t)和(t)。将所求得的X(t)和(t)代入式（1.6.14）中，可求得相应的U(t)。,),(),(),()(ttttXUtXftX,),(),(),()(ttttXUtXHXt说明：（1）对于两点边界值问题，一般难以求得其解析解，通常需要采用数值计算方法求其数值解。（2）利用引入哈密顿函数的方法求解拉格朗日型最优控制问题，是将求泛函（1.6.3）在等式（1.6.1）约束条件下对控制函数U(t)的条件极值问题转化为求哈密顿函数H对控制变量U(t)的无条件极值问题。这种方法称为哈密顿方法。定理1.6.1 设系统的状态方程 ),(),()(ttUt

51、XftX则为将系统从给定的初态00)(XtX转移到终端时刻 tf固定，终端状态X(tf)自由的某个终态，并使性能泛函fttdtttUtXLJ0),(),(达到极小值的最优控制应满足的必要条件是（1）设U*(t)是最优控制， X*(t)是对应于U*(t)的最优轨线，则必存在一与U*(t)和X*(t)相对应的n维协态变量(t) ，使得X(t)与(t) 满足规范方程),(),()(ttUtXfHtXXHt)(其中),(),()(),(),(ttUtXftttUtXLHT （2）边界条件为00)(XtX0)(ft （3）哈密顿函数H对控制变量U(t)（t0ttf）取极值，即0UH* 沿着最优控制和最

52、优轨线，哈密顿函数H对时间t求全导数，得UUHHXXHtHdtdHTTTUUHXHHHXHtHTTTtH若H不显含t时，则有 H(t)=常数 tt0，tf; 也就是说，当H不显含t时，哈密顿函数H是不依赖于t的常数。例1.6.1 已知系统方程和边界条件为,2221uxxxx,1)0(1)0(21xx0) 1 (0) 1 (21xx求使性能泛函102)(21dttuJ为极小值的最优控制函数与最优轨线。解：这是一个最小能量控制问题。其哈密顿函数为uxxuH22221221由控制方程02uUH得2u协态方程为01212解协态方程，得11c122212cecct于是teccu21由状态方程tecc

53、xxxx212221解得tteccecx2132214213121cectcecxtt利用边界条件0) 1 (, 0) 1 (, 1)0(, 1)0(2121xxxx求得积分常数为2309.11,0335. 5,5288.30,2979.194321cccc于是，最优控制与最优轨线分别为tetu5288.302979.19)(*2309.112644.152979.190335. 5)(*1ttetetxtteetx2644.152979.190335. 5)(*2可以利用MATLAB符号工具箱求解上述微分方程，程序如下：syms l1 l2 x1 x2; s=dsolve(D1l1=0,D1

54、l2=-l1-l2,D1x1=x2,D1x2=x2-l2,x1(0)=1, x2(0)=1,x1(1)=0,x2(1)=0,t)l1=s.l1, l2=s.l2,x1=s.x1,x2=s.x2运行结果为：s = l1: 1x1 sym l2: 1x1 sym x1: 1x1 sym x2: 1x1 syml1 =-2*exp(1)/(exp(1)-3)l2=2*exp(1)/(exp(1)-3)-2*exp(1)/(exp(1)-3)*exp(-t)-2*exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)x1=-exp(1)/(exp(1)-3)*exp(t)+2*exp

55、(1)/(exp(1)-3)*t+exp(1)/(exp(1)-3)*exp(-t)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)-2*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(t)x2=2*exp(1)/(exp(1)-3)-exp(1)/(exp(1)-3)*exp(-t)-exp(1)/(exp(1)-3)*exp(t)-exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+

56、exp(t) 例1.6.2 问题同例1.6.1，只是终端条件为x1(1)=0，x2(1)自由，求该最优控制问题。解：问题的规范方程和控制方程均与例1.6.1相同，但边界条件变为0) 1 (, 0) 1 (, 1)0(, 1)0(2121xxx由这些边界条件求得的积分常数为1623. 6,2880. 0,7486. 9,5863. 34321cccc于是，所求得的最优解为teu7486. 95863. 3*1623. 68743. 45863. 32880. 0*1ttetextteex8743. 45863. 32880. 0*2 由例1.6.1和例1.6.2可见，对于两个相同的最优控制问题，

57、只是部分终端状态不相同，所得到的最优解则完全不同。1.6.2 波尔扎问题的解问题1.6.2 给定系统状态方程),(),()(ttUtXftX(1.6.18)初始条件00)(XtX(1.6.17)和性能泛函fttffdtttUtXLttXJ0),(),(),(1.6.19)要求从容许控制U(t) Rm中确定最优控制U*(t)，使系统（1.6.17）从给定的初态X(t0)转移到某个终态X(tf) ，并使性能泛函（1.6.19）达到极小值。这是波尔扎问题，又称为复合型最优控制问题。由于给定的端点条件不同，上述最优控制问题的解将不同。下面根据三种不同的端点条件，分别予以讨论。 1. 终端时刻tf固定

58、，终端状态X(tf) 自由的情况构造辅助泛函为：),(0ffttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(若令哈密顿函数为),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHHT（1.6.20）（1.6.21）并对式（1.6.20）积分号内第三项进行分部积分，则辅助泛函变为ffttTttTfftXtdttXtttUttXHttXJ00)()()()(),(),(),(),(0dtXtttUttXHtXttXtttXfttTTffTff0)()(),(),(),()()()()(),(00（1.6.22）求上式对状

59、态变量X(t)和控制变量U(t)的变分，得0000(),()()()( )( )()+-fTffTTffffTTTtTTtX ttJX ttX ttX tX tHHHXUXdtXU（1.6.24）由于泛函J0达到极值的必要条件为00J（1.6.23）由于X(t0)=0， X(tf)0， X(t)0， U(t)0，则由式（1.6.23）和（1.6.24）可得上述波尔扎型最优控制问题的解应满足的必要条件为00)(),(),()(0)(XtXttUtXfHtXUHXHt这些关系与拉格朗日型最优控制问题的完全相同，所不同的只是横截条件，即协态变量的终端值)(),()(fffftXttXt 2. 终端时

60、刻tf固定，终端状态X(tf) 受约束的情况设终端状态受到如下等式的约束0),(ffttX（1.6.25）其中为r（当L=0，rn-1；当L0，rn）维向量，即Tr,21这时，终端状态X(tf)即不是固定的，也不是完全自由的，只能在终端流型（1.6.25）上变动。在构造辅助泛函时，应考虑终端约束条件（1.6.25），为此，需要引入待定的拉格朗日乘子向量Tr,21于是，所构造的辅助泛函为),(),(0ffTffttXttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(考虑到哈密顿函数为),(),()(),(),(),(),(),(ttUtXftttUtX

61、LttUttXHHT（1.6.26）并对式（1.6.26）积分号内第三项进行分部积分，则辅助泛函变为dtXHtXttXtttXttXdtXHtXtttXttXJfffttTTffTffTffttTttTffTff000)()()()(),(),()()(),(),(000求J0对状态变量X(t)和控制变量U(t)的变分，得0000(),(),()()()()()()( )( )(),(),()()fTTTffffffffTTtTTTfftTTffffffX ttX ttJX tX tX tX tHHtX ttX tXUXdtXUX ttX ttX tX t 000()()( )( )+-fTT

62、ffTTTtTTTttX tHHHtX tXUXdtXU考虑到 J0=0, X(t0)=0， X(tf)0， X(t)0， U(t)0，则得到所述最优控制问题的解应满足的必要条件00)(),(),()(0)(XtXttUtXfHtXUHXHt这些关系与1中的完全相同，所不同的是状态变量的终端约束条件和横截条件fttTfffXXtttX)(0),( 3. 终端时刻tf可变，终端状态X(tf) 受约束的情况设终端状态X(tf)受到式（1.6.25）的约束条件。辅助泛函为),(),(0ffTffttXttXJfttTTdttXtttUtXftttUtXL0)()(),(),()(),(),(fft

63、tTttTdtXHttXttX0)(),(),(),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHHT其中这时，不仅存在最优控制和最优轨线，还存在一个最优的终端时刻。最优控制和最优轨线应满足2中的必要条件，即XHtttUtXfHtX)(),(),()(（1.6.27）00)(0XtXUHfttTfffXXtttX)(0),( 为了确定最优的终端时刻，令式（1.6.27）对时间t的全导数等于零，即00fttdtdJ得0fttTTTTTXHtXXtXX代入0fttTttH（1.6.28）式（1.6.28）也称为横截条件。定理1.6.2 设系统状态方程为 ),()

64、,()(ttUtXftX则为将系统从给定的初态00)(XtX的某个终态X(tf)，其中 tf是可变的，并使性能泛函转移到满足约束条件0),(ffttXfttffdtttUtXLttXJ0),(),(),(达到极小值的最优控制应满足的必要条件。（1）设U*(t)是最优控制， X*(t)是对应于U*(t)的最优轨线，则必存在一与U*(t)和X*(t)相对应的n维协态变量(t) ，使得X(t)与(t)满足规范方程XHtttUtXfHtX)(),(),()(),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHHT其中（2）边界条件为00)(XtXfttTfffXX

65、tttX)(0),(0fttTttH （3）哈密顿函数H对控制变量取极值，即0UH 应当指出，对于波尔扎问题来说，哈密顿函数H的性质tHdtdH仍然成立。当H不显含t时H(t)=常数 tt0，tf例1.6.3 给定系统状态方程uxxxx22211)0(1)0(21xx初始条件：和性能泛函：102222121)1 () 1 (21dtuxxJ 解：问题的规范方程和控制方程均与例1.6.1相同。要求确定最优控制u*(t) ，使性能泛函J达到极小值。,12211ceccttttteccecxcectcecx2132421312121边界条件为：,1)0(1)0(21xx) 1 () 1 () 1 (

66、) 1 (2211xxteccu21将边界条件代入规范方程，得11212131412132134235 . 05 . 015 . 015 . 0cececcecccecceccccccc解得8449. 2,2888. 0,2674. 4,4225. 14321cccc于是，最优控制为：tetu2674. 44225. 1)(*例1.6.4 给定系统状态方程为：uxxx221初始条件：0)0(, 0)0(21xx终端约束条件：1) 1 () 1 (21 xx性能泛函：10221dtuJ需要确定最优控制u*(t)，使性能泛函J达到极小值。解：写出哈密顿函数uxuH221221控制方程、规范方程为220uuuH2121221111)()(0ctctxHctxH32212212432231121212161ctctcxctcxctctctcxxx由边界条件0)0(, 0)0(21xx1) 1 () 1 (21 xx) 1 () 1 (,) 1 () 1 (2211xx解得五个未知数0, 0,762,734321cccc所以，最优控制为：7673)(*ttu最优轨线为：tttxtttx7614

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

变分法及其在最优控制中的应用(1)

文档简介

温馨提示

最新文档

评论

相关内容推荐

合作伙伴

龙岗网络公司

深圳网站优化

龙岗网站建设

坪山网站建设

百度标王推广

天下网标王

SEO优化按天计费

SEO按天计费系统

变分法及其在最优控制中的应用(1)

文档简介

温馨提示

最新文档

评论

相关文档

相关内容推荐

合作伙伴