中北大学2011届毕业设计说明书
2 最优控制的基本概念
2.1 最优控制基本思想
设系统状态方程为
x(t)?f[x(t),u(t),t],x(t0)?x0 (2-1) 式中,是p维控制向量;n维向量函数f[x(t)x(t)是n维状态向量;u(t),u(t),t]是x(t),u(t)与t的连续函数,且对x(t)与t连续可微;u(t)在[t0,tf]上分段连续。所谓最优控制问题,就是要求寻找最优控制函数,使得系统状态x(t)从以知初态x0转移到要求的终端状态x(tf),在满足如下约束条件下: (1)控制与状态的不等式约束
g[x(t),u(t),t]?0 (2-2) (2)终端状态的等式约束
M[x(tf),tf]?0 (2-3) 使性能指标
tf J??[x(tf),tf]??F[x(t),u(t),t]dt (2-4)
t0达到极值。式中g[x(t),u(t),t]是
m?p;M[x(tf),tf]是q维连续可微的向量函数m维连续可微的向量函数,
的连续可
,q?n;?[x(t),u(t),t]都是x(t)与t微纯量函数。
2.2 最优控制的性能指标
自动控制的性能指标是衡量系统性能好坏的尺度,其内容与形式取决于最优控制问题所要完成的任务,不同的控制问题应取不同的性能指标,其基本类型如下。 2.2.1 积分型性能指标
tf J?t0F[x(t),u(t),t]dt
(2-5)
第3页 共39页
中北大学2011届毕业设计说明书
表示整个控制过程中,系统的状态x(t)与施加给系统的控制作用u(t)应当达到某些要求。例如:
(1)最小时间控制
当选取 F[x(t),u(t),t]? 则
tf J??dt?tf?t0 (2-6)
t0这种控制要求设计一个快速控制规律,使系统在最短时间内从以知的初态x(t0)转移到要求的末态x(tf)。例如,导弹拦截器的轨道转移就是属于此类问题。
(2)最小燃料消耗控制
m当选取 F[x(t),u(t),t]?则
tfm?j?1uj(t)
J?t0j?1??uj(t)dt (2-7)
是航天工程中常遇到的重要问题之一。例如,宇宙飞船这种航天器具所携带的燃料有限,希望在轨道转移时,所消耗的燃料尽可能的少,就是属于此类问题。 (3)最小能量控制
当选取 F[x(t),u(t),t]?uT(t)u(t) 则
tf J??uT(t)u(t)dt (2-8)
t0 对于一个能量有限的物理系统,例如,通信卫星的太阳能电池,为了使系统在有限的能源条件下载尽可能长的时间内保证正常工作,需要对控制过程中的能量消耗进行约束,就是属于此类问题。
(4)无线时间线性调节器 取tf??,且
第4页 共39页
中北大学2011届毕业设计说明书
F(x,u,t)?其中,Q?0,R?0,均为加权矩阵,则
J?1?TT(t)Qx(t)?u(t)Ru(t)]dt (2-9)
12[x(t)Qx(t)?u(t)Ru(t)]
TT?[x2t0 (5)无限时间线性跟踪器 取tf??,且
F(x,u,t)?{[y(t)?z(t)]TQ[y(t)?z(t)?uT(t)Ru(t)]}
J?(2-10)
其中,y(t)为系统输出向量,z(t)为系统希望输出向量。
在性能指标式(2-8)、式(2-9)、式(2-10)中,被积函数都是由x(t)、y(t)?z(t)或u(t)的平方项所组成,这种形式的性能指标叫做二次型性能指标。 2.2.2 末值型性能指标
J??[x(tf),tf] (2-11) 表示系统在控制过程结束后,要求系统的终端状态x(tf)应达到某些要求,在实际工程中,例如要求导弹的脱靶量最小、机床工作台移动准确停止等。终端时刻tf可以固定,也可以自由,视最优控制问题的性质而定。 复合型性能指标
tf1?TTQ[y(t)?z(t)]?u(t)Ru(t)}dt
?{[y(t)?z(t)]2t0 J??[x(tf),tf]??F[x(t),u(t),t]dt (2-12)
t0表示对整个控制过程及控制过程结束后的终端状态均有要求,是最一般的性能指标形式。
2.3 最优控制问题的求解方法 1. 解析法
当性能指标与约束条件为显示解析表达式时,适合用解析法。通常是用求导方法或
第5页 共39页
中北大学2011届毕业设计说明书
变分方法解出最优控制的必要条件,从而得到一组方程式或不等式,然后求解这组方程或不等式,最后得到最优控制的解析解。 2. 数值计算法
当性能指标比较复杂或不能用变量的显函数表示时,可以采用试探法,即直接搜索 逐步逼近,经过若干次迭代,逐步逼近到最优点。 3.梯度型法
这是一种解析与数值计算相结合的方法。
第6页 共39页
中北大学2011届毕业设计说明书
3 最连续系统最优控制的MATLAB实现
3.1连续系统线性二次型最优控制 设线性连续定常系统的状态方程为:
x(t)?Ax(t)?Bu(t),x(0)?x0 (3-1) 式中,x(t)为n维状态向量;u(t)为p维控制向量,且不受约束;A为n?n维常数矩阵,
B为n?p维常数矩阵。
?.系统的性能指标为: J?1??20xQx?uRudtTT (3-2)
式中,终端时间无限;Q为维数适当的常数矩阵(常取n?n维常数矩阵);R为维数适当的常数矩阵,R?0,R?RT。若下列条件之一满足:
(1)Q?0,Q?QT,阵对[A,B]完全可控; (2)Q?0,Q?QT,阵对[A,B]完全可控,阵对矩阵。
则有最优反馈矩阵:
K?R?1BTP (3-3) 与唯一的最优控制:
u*(t)??Kx(t)??R?1BTPx(t) (3-4) 以及最优性能指标:
J*?12x(0)Px(0)[A,D]完全可观,DDT?Q,D为任意
(3-5)
式中,P为常值正定矩阵,它是以下黎卡提代数方程的唯一解: PA?ATP?PBR闭环系统:
x(t)?(A?BR?1BTP)x(t),x(0)?x0 (3-7)
??1BP?Q?0T (3-6)
第7页 共39页