吉林大学
1 引言
自适应控制的研究对象是具有一定程度不确定性的系统,这里所谓的“不确定性”是指描述被控对象及其环境的数学模型不是完全确定的,其中包含一些未知因素和随机因素。
任何一个实际系统都具有不同程度的不确定性,这些不确定性有时表现在系统内部,有时表现在系统的外部。从系统内部来讲,描述被控对象的数学模型的结构和参数,设计者事先并不一定能准确知道。作为外部环境对系统的影响,可以等效地用许多扰动来表示。这些扰动通常是不可预测的。此外,还有一些测量时产生的不确定因素进入系统。面对这些客观存在的各式各样的不确定性,如何设计适当的控制作用,使得某一指定的性能指标达到并保持最优或者近似最优,这就是自适应控制所要研究解决的问题。
自适应控制和常规的反馈控制和最优控制一样,也是一种基于数学模型的控制方法,所不同的只是自适应控制所依据的关于模型和扰动的先验知识比较少,需要在系统的运行过程中去不断提取有关模型的信息,使模型逐步完善。具体地说,可以依据对象的输入输出数据,不断地辨识模型参数,这个过程称为系统的在线辩识。随着生产过程的不断进行,通过在线辩识,模型会变得越来越准确,越来越接近于实际。既然模型在不断的改进,显然,基于这种模型综合出来的控制作用也将随之不断的改进。在这个意义下,控制系统具有一定的适应能力。比如说,当系统在设计阶段,由于对象特性的初始信息比较缺乏,系统在刚开始投入运行时可能性能不理想,但是只要经过一段时间的运行,通过在线辩识和控制以后,控制系统逐渐适应,最终将自身调整到一个满意的工作状态。再比如某些控制对象,其特性可能在运行过程中要发生较大的变化,但通过在线辩识和改变控制器参数,系统也能逐渐适应。
常规的反馈控制系统对于系统内部特性的变化和外部扰动的影响都具有一定的抑制能力,但是由于控制器参数是固定的,所以当系统内部特性变化或者外部扰动的变化幅度很大时,系统的性能常常会大幅度下降,甚至是不稳定。所以对那些对象特性或扰动特性变化范围很大,同时又要求经常保持高性能指标的一类系统,采取自适应控制是合适的。但是同时也应当
1
通信工程学院 张艳辉 2010522112
指出,自适应控制比常规反馈控制要复杂的多,成本也高的多,因此只是在用常规反馈达不到所期望的性能时,才会考虑采用。
反馈控制用来较精确地控制绝大部分运行状况,某些情况下加上前馈控制还可达到减少输入扰动影响的目的。但有些对象具有很大的不确定性、 时变性和内外扰动, 简单的反馈加前馈控制效果很不理想。长期以来, 这是自动控制领域所面临的一个非常具有挑
战性的问题,自适应控制正是在这样的背景下提出的。其基本思想是通过不断地监测被控对象,根据其变化来调整控制参数,从而使系统运行于最优或次优状态。自适应控制最初( 2 0世纪 5 0年代末期) 主要应用于航天航空领域,此时相应的理论和方法还不成熟,应J{ { 上遇到一些失败,但部分人仍然坚持研究,并将其应用推广至其他工业部门; 到七十年代随着控制理论和汁算机技术的发展,自适应控制取得重大进展,在光学跟踪望远镜、化工、冶金、机加工和核电中的成功应用也充分证明了其有效性;此后,自适应控制技术的应用更得到大幅度扩展;目前从美国新的登月计划到临床医学领域,自适应控制技术的应用都方兴未艾。本文总结自适应控制在国内外的应用研究概况。
2 自适应控制发展现状
稳定自适应控制是近年来基于神经网络自适应控制方法研究的主流。按照所使用神经网络的类型,可以将其分为:基于线性参数化神经网络、 多层和动态神经网络的稳定自适应控制。
基于线性参数化神经网络的稳定自适应控制首先由Sanner和
Polycarpou等人于1991年针对连续非线性系统提出。他们的工作促进了人们在这一领域的深入研究。通过采用线性参数化神经网络, 可调参数与神经网络基函数的线性关系成立。所以传统自适应控制的严格结论可以直接用于神经网络的权值调整,从而得到稳定的闭环控制系统。通常,李雅普诺夫稳定理论或无源性理论用于设计全局稳定的闭环控制系统。这里, 典型的应用是将直接的和间接的神经网络自适应方法和变结构方法结合以得到改进的系统性能,变结构用于克服系统的建模误差,保证系统的全局稳定性。
吉林大学
相对于线性参数化神经网络,多层神经网络具有许多独特的优点。首先, 多层神经网络具有较好的逼近精度;其次,采用多层神经网络的自适应控制器可调参数较少,这对控制的实时实现是非常重要的
Chen 等人于 1992年成功地将多层神经网络用于非线性系统的自校正控制问题中,作者提出了一种带有死区的权值调整算法,并给出了系统局部 收敛性的证明。然而,提出的控制器性能仍然依赖死 区的选择和输入信号的激励性,并且需要初始的神 经网络离线学习过程。1995年,Lewis等人提出采用三层前向神经网络结构的控制器,中间隐层采用的是非线性变换函数,而神经网络输出与输出层权值成非线性关系。他们基于李雅普诺夫稳定理论给出了一、二层和输出层权值调整算法,并讨论了神经网络调整算法的无源性,得到了保证性能的神经网络稳定自适应控制方法。L ewis的工作是这一领域的先导,其后他的研究组又在这一领域做出了一系列的卓有成效的工作。此外,孙富春等人进一步研究了基于观测器的机械手多层神经网络自适应控制方
由于含有反馈连接,动态神经网络固有的动态记忆使得它特别适合于动态系统的建模与控制。动态神经网络不仅能够模拟某些动态行为,如极限环和混沌等,而且能够以较小的规模提供规模大得多的多层 神 经 网络 的性 能。 1990年,Narendra和 Parthasarathy最早将动态神经网络应用于非线性系统的辨识与控制。然而,他们没有提供闭环系统稳定性的证明。1994和1999年,Rovithakis等人采用动态神经网络研究非线性动力学未知系统的神经网络稳定自适应控制。提出的控制算法分两步进行。首先,采用一个动态神经网络完成“黑箱” 辨识, 然后,用动态反馈对非线性系统进行控制。 文中采用奇异摄动分析研究了动态神经网络辨识器的稳定性和鲁棒性, 并研究了各种建模误差对系统性能的影响。 由于滑模控制对模型不确定性的鲁棒性, 人们已开始研究将动态神经网络与滑模控制相结合。 比较典型的工作是 Edgar和 Miguel 于2000年提出的自适应神经网络控制器, 系统控制律包括神经网络的线性化项、 反馈控制和滑模项。 该控制器不需要离线训练, 但要求系统状态完全可量测且已知建模误差的界 。
离散系统的神经网络稳定自适应控制
3
通信工程学院 张艳辉 2010522112
由于现有的控制系统大多采用计算机控制,研究离散非线性系统的神经网络自适应控制具有重要的现实意义。 然而,与连续系统相比,离散系统还存在以下的困难:1 )为保证系统稳定,有时需要持续激励。 离散系统如何获得持续激励, 是一个未解决的问题; 2 ) 如果系统的相对阶大于一, 当前输入将依赖于系统的未来状态, 即所谓的非因果性( c a u s a l i t y ) ; 3 )对于多输入/ 出离散系统, 如何对系统进行解耦也是目前的一大难题。 另外, 李亚普诺夫函数的选择会更加困难。 正因为以上这些问题, 使得在离散系统的神经网络 自适应控制方面的研究成果相对较少 。
为了解决单输入/ 出离散系统的非因果性问题, 人们通常采用坐标变换的方法, 将一步提前描述变换成多步预测的形式, 在此基础上设计神经网络自适应控制器。 目前 自适应控制器的设计主要是基于反馈线性化的方法, 采用等效控制器或者离散“ 后退” 设计算法进行设计。 由于子系统间存在耦合, 其控制律的设计远较单输入/ 出系统困难。Jagannathan在 1 9 9 6年提出了采用两层和多层神经网络逼近系统中的未知函数, 应用改进的权值调整算法, 避免了常规离散神经自适应方法对持续激励的要求。 他们的工作起先是针对一类解耦的 mn阶多输入/ 出离散系统, 后来又将其推广到了一般性的离 散非线性系统。
鉴于现有神经网络稳定自适应控制研究中采用的神经网络和变结构控制机械结合的模式, 即在状态空间的某一区域以外采用变结构控制, 区域以内采用神经网络控制, 孙富春等人提出了扇区神经变结构控制的思想,并在此基础上建立了较为系统的多输入/ 出采样非线性系统的神经网络稳定 自适应控制方法。 扇区神经变结构控制的控制量是神经网络基函数与系统状态误差的有机调制, 它能随着系统跟随误差度量向开关流形的趋近, 动态地调整控制量的大小以有效地补偿系统的动力学不确定性, 加速神经网络权值的收敛速度, 改善系统的稳定性和动态性能。 后来, 他们又研究了基于动态神经网络的离散非线性系统自适应控制方法, 设计方法除继承了静态神经网络稳定 自适应控制方法的优点外, 通过动态逆的设计, 保证了闭环系统在初始段的动态性能, 克服了目前大多数动态神经网络自适应方法需要系统状态位于某一紧集的局限。
吉林大学
神经模糊稳定自适应控制
根据规则后件的类型, T - S模糊模型可以分为两类: 静态和动态的T - S模糊模型。 具有线性状态函数的静态T - S模糊模型可以表示为某种前向神经网络的形式, 其在控制器设计中的作用是作为非线性函数的逼近器。 这样, 静态神经网络自适应控制的所有方法都适用于静态 T - S 模糊模型。 这些工作包括反馈线性化非线性系统的稳定 自适应模糊控制和基于滑模的机械手模糊自适应控制器的设计等。
动态T - S模糊模型是规则后件为线性动态方程的模糊模 型, 这些线性动态方程可以是状态方程、 广义系统模型和线性奇异摄动模型等。因此, 现代控制领域的控制器综合方法都可以应用于这类系统控制器的设计。 一方面, 动态 T - S模糊模型可以用于研究基于模型的控制方法, 这是 目前该领域研究的主流, 代表性的工作包括: 二次型性能指标下的连续和离散最优控制, 应用 L MI 的鲁棒最优模糊控制, H∞控制等等, 这里分段连续和多李雅普诺夫函数已成为该类系统综合的主要工具。 另一方面, 将动态T - S模糊模型用作非线性动态系统的逼近器, 研究基于动态神经模糊系统的自适应控制方法。 动态神经模糊系统不仅可以模拟极限环、 混沌等动态行为, 而且能够以比动态神经网络小的网络规模达到相同的逼近效果。 然而, 目前这方面的研究工作还很少。 2 0 0 3 年, Wa n g 等人将神经模糊控制和传统的 P D控制相结合,动态神经模糊系统作为前馈控制用于逼近自主水下潜器的逆动力学,使得系统非线性对于潜器沿期望轨迹运动的影响最小,而反馈回路 P D控制则用来减小潜器的跟随控制误差。 然而, 由于动态神经模糊系统采用梯度法学习, 系统的全局稳定性难于在理论上得到保证。 冯刚等人的工作是基于模型参考 自适应方法, 根据模糊子集将动态模糊系统分为几个子系统, 对每一个子系统设计控制器, 子系统问的互联耦合作为非线性不确定项, 采用滑模控制进行补偿。 在每一个子系统中, 取隶属度最大的作为最终控制器。 采用分段连续的李亚普诺夫函数来证明系统的稳定性。 缺点是需要调节的参数随着子系统的增加而成倍增加, 增大了计算量, 此外, 系统的收敛速度也难于保证。 以上两种设计方法在实际应用中遇到的共同问题就是要求系统的状态应位于某一紧
5