2.跟踪任务
在有限时间区间【o,刀上,给定可达的期望轨迹儿(fx,∈【o,刀)和相应的期望 青岛理工大学工学硕士学位论文
D型学习律 ,
甜“l(f)=%(,)+Fek(r) (4.7)
P型学习律
材I“(f)=ⅣIO)+LeI(f) (4.8)
组合型学习律(PI型,PD型,PID型)一般可以统一由PID型学习律表示
(4.9) ?。(t)--?(r)+FP。(.)+&。(,)+ll,^o)卉
式中,、L、?为定常增益矩阵。
5.停止条件
在每一次重复操作结束时,需要检查停止条件。若停止条件成立,则停止迭
代运行。常见的停止条件为:
帆(f)一儿删ss (4.10)
式中s为给定的允许跟踪精度。另外,停止条件也可以通过限定最大迭代次
数给出.
6.干扰环境
在第l|}次迭代时,记坼(f)∈R9为状态干扰向量,vI(f)∈R。为输出干扰向量。
它们或为确定性干扰,或为随机干扰。在干扰环境中重复运行的控制系统(4.2)可
表示为:
●
I
以(f)=厂瓴(r),硌(硗%(,),f)}(4.11) YI(r)=g(hO),虬(f),叱(r),,)J
实际中,学习控制系统受到的干扰除状态和输出干扰外,还包括初态偏移、
输入扰动、期望轨迹变动以及学习区间偏移等等。
4.3.4迭代学习控制的工作原理
设被控对象的动态过程如式(4.1)所示,其结构和参数均未知。若期望控制
?(f)存在,则迭代学习控制的目标为:给定期望输出儿(f)和每次运行的初始状
xt(0),要求在给定的时间,E【0,刀内,按照一定的学习律通过多次重复运行,
使控制输入?(f)---h?(f),而系统输出n(f)寸.,,,O)a如图4.1所示·
图4-3闭环学习控制的基本结构
4.3.5迭代学习控制的学习律
1.D型学习律‘删
在已提出的多种学习律中,D型学习律是首先被提出来的一种。其修正作用
项仅利用输出误差ek(t)=Yk∽一儿(,)的导数信号气(f),即:
g/k+lO)=%(,)+Fet(r) (4.14)
式中,t E【0,T],七为迭代次数,r为定常增益矩阵。又可以写成:
k-I .
?o)=?(r)+r∑q∽ (4.15)
l-0
从式(4.15)n--]'以看出,该学习律是以误差导数信号的累加构成控制输入信号.
2.P型学习律咖
对于正则系统,学习律只需使用输出误差本身;对于r阶非正则系统,学习
律中可使用输出误差的r阶导数。然而,当实际运行中的学习控制系统存在量测
噪声时,量测噪声会严重影响学习律中的高阶导数运算。为了提高系统跟踪性能,
应采取有效措施抑制噪声。显然,一种主要途径是在学习律中回避对输出误差信
号的高阶导数运算,而使用尽可能的低阶导数运算,或直接使用输出误差信号。
仅使用输出误差信号的学习律为P型学习律,即:
l/k+1(r)=蚝(f)+LeI(f) (4.16)
式中,e。(t)输出误差信号,三为学习增益矩阵·该学习律又可以写成:
k-I
村‘(,)=Ito(f)+上∑P.(f)(4.17)
该学习律的含义是,以输出误差信号的累加构成控制输入信号。
3.PID型学习律H町
单纯的D型学习律(4.14)可调整的参数只有r。当r确定以后,学习系统的跟
踪性能和收敛速度也基本上随之确定。为了提高收敛速度,改善跟踪性能,需要
在学习律中添加可调整的参数项。这样就构成了PD型学习律和DI型学习律。
蚝“(f)=?(f)+r%o’+工气(f) (4.18)
12k+IO)=?(O+r%(,)+甲扣I(f)咖 (4.19)
式(4.18)为PD型学习律,它比D学习律增加了可调整增益z;式(4.19)为Ⅸ
型学习律,它比D型学习律增加了可调整增益甲。一般可以统一由PID型学习律
表示:
“。“O)=?(t)+Fet(卅地∽+甲/%(r)咖(4.20)
当学习增益r、Z、甲取不同值或零值时,就可以构成P型、PI型、D型、
DI型和PID型学习律。
4.4称重配料过程的进一步分析
第三章推导出了称重配料过程的数学模型。由于该模型是一个非线性的不确
定性模型,难以用传统的方法对它进行控制。为了能采用智能控制的方法,我们
在模型仿真曲线的基础上,对配料的过程作进一步的分析。其配料的动态过程如
图“所示。
图4-4称重配料过程示意图 青岛理工大学工学硕士学位论文
J续2七喙2七∽饿一Ⅳ) 秘∞
式中,k一比例系数(m/kg)
空中余料的高度为:
h=H一缺2日一k(w设一Ⅳ) 秘M
于是,可以得到空中余料的重量: .
%=p鼢=硝日一七(%一训 缁西
式中,P一物料在空中的比重(kg/m3)
S—给料门的横截面积(m2)
秤斗内最终的实际重量为:
岷2w关+№
2№一Ⅳ+pS[H一七(愧一刎
2w硅一“+pSH—pSkw设+pSku
=(p瓣一1)u+(1一l哂k)w+pSH
(4.26)
由此可见,最终的称量值16'磐与p、S、k、H、摊等参数有关,其中S、k、
日易于确定,只有P难以预先确定,但在一段时间内,物料的湿度应该变化不大,
所以P可以看作相对稳定。这样,在设定值w,设一定的情况下,最终的称量值\,磬
直接受关门提@JIu的控制。可以看作w,弗为Ⅳ的函数,即
M,磐_.厂(Ⅳ) (4.27)
因此,如果能确定关门提前量,就能使最终的称量结果满足设定要求。
4.5迭代学习控制算法在配料过程中的应用
迭代学习控制的基本思想是,基于多次重复训练(运行),只要能保证训练过
程的系统不变性,控制作用的确定可在模型不确定的情况下获得有规律的认识,
使系统的实际输出逼近期望输出。
图4.6迭代学习控制的选代过程
4.6计算机仿真与分析
为了验证上面的控制算法,我们用MATLAB的动态仿真工具箱Simulink对
系统进行了仿真。相关参数取为:H=1.Sm、S=0Am2、p=800kglm3、Uo=
lOOkg、Wtt=loookg。为了考察加权学习因子,对迭代过程的影响,选取两组不
同的学习因子,=o.3和,=0.6进行仿真,仿真结果如图4.7和4.8所示。
从图中可以看出,关门控制量的初值u。=lookg,经过多次迭代学习,不断
优化,最后稳定在50kg左右,实际的配料称重量也稳定在设定值1000kg左右,
取得了满意的控制效果。
比较两幅图可以看出,学习因子的大小对迭代学习的速度有较大影响。当取
,=O.3时,实际的配料重量经过20次迭代,才使称量值接近设定值;而当r=0.6