北方民族大学结业论
文
课程名称: 矩阵计算
院(部)名 称: 信息与计算科学学院 学号: 20093419 姓名: 司委 班级: 09级信计三班
设 计 时 间: 2011.12.13----2011.12.5
矩阵的认识及其在二次型中的应用
先谈谈对线形空间和矩阵的几个核心概念的理解。首先说说空(space),从拓扑空间开始,一步步往上加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。
我们一般人最熟悉的空间,毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:1. 由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动。凡是讨论数学问题,都得有一个集合,大多数还得在这个集合上定义一些结构(关系),并不是说有了这些就算是空间。容纳运动是空间的本质特征。
我们就可以把我们关于三维空间的认识扩展到其他的空间。事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。因此只要知道,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动 下面我们来看看线性空间。线性空间中的任何一个对象,通过选取基和坐标的办法,都可以表达为向量的形式。通常的向量空间我就不说了,举两个不那么平凡的例子: L1. 最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空间中的每一个对象是一个多项式。如果我们以x0, x1, ..., xn为基,那么任何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分量ai其实就是多项式中x(i-1)项的系数。值得说明的是,基的选取有多种办法,只要所选取的那一组基线性无关就可以。这要用到后面提到的概念了,所以这里先不说,提一下而已。 L2. 闭区间[a, b]上的n阶连续可微函数的全体,构成一个线性空间。也就是说,这个线性空间的每一个对象是一个连续函数。对于其中任何一个连续函数,根据魏尔斯特拉斯定理,一定可以找到最高次项不大于n的多项式函数,使之与该连续函数的差为0,也就是说,完全相等。这样就把问题归结为L1了。后面就不用再重复了所以说,只要你找到合适的基,用向量可以表示线性空间里任何一个对象。向量表面上只是一列数,但是其实由于它的有序性,所以除了这些数本身携带的信息之外,还可以在每个数的对应位置上携带信息。为什么在程序设计中数组最简单,却又威力无穷呢?根本原因就在于此。
线性空间中的运动,被称为线性变换。在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的乘法施加运动。矩阵的本质是运动的描述。向量本身不是也可以看成是n x 1矩阵吗?这实在是很奇妙,一个空间中的对象和运动竟然可以用相类同的方式表示。接着理解矩阵。在这个文章里,“运动”的概念不是微积分中的连续性的运动,而是瞬间发生的变化。比如这个时刻在A点,经过一个“运动”,一下子就“跃迁”到了B点,其中不需要经过A点与B点之间的任何一个点。这样的“运动”,或者说“跃迁”,是违反我们日常的经验的。不过了解一点量子物理常识的人,就会立刻指出,量子(例如电子)在不同的能量级轨道上跳跃,就是瞬间发生的,具有这样一种跃迁行为。所以说,自然界中并不是没有这种运动现象,只不过宏观上我们观察不到。但是不管怎么说,“运动”这个词用在这里,还是容易产生歧义的,说得更确
切些,应该是“跃迁”。因此这句话可以改成:“矩阵是线性空间里跃迁的描述”。 所谓变换,其实就是空间里从一个点(元素/对象)到另一个点(元素/对象)的跃迁。比如说,拓扑变换,就是在拓扑空间里从一个点到另一个点的跃迁。再比如说,仿射变换,就是在仿射空间里从一个点到另一个点的跃迁,实际上是在仿射空间而不是向量空间中进行的。想想看,在向量空间里相一个向量平行移动以后仍是相同的那个向量,而现实世界等长的两个平行线段当然不能被认为同一个东西,所以计算机图形学的生存空间实际上是仿射空间。而仿射变换的矩阵表示根本就是4 x 4的。矩阵的定义:“矩阵是线性空间里的变换的描述。”
在一个线性空间V里的一个线性变换T,当选定一组基之后,就可以表示为矩阵。线性变换的定义是很简单的,设有一种变换T,使得对于线性空间V中间任何两个不相同的对象x和y,以及任意实数a和b,有:
T(ax + by) = aT(x) + bT(y),那么就称T为线性变换。 矩阵的定义完善如下:
“矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。” 同一个线性变换的矩阵的一个性质:
若矩阵A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关系:A = P-1BP。所谓相似矩阵,就是同一个线性变换的不同的描述矩阵。而在上面式子里那个矩阵P,其实就是A矩阵所基于的基与B矩阵所基于的基这两组基之间的一个变换关系。矩阵的相似变换可以把一个比较丑的矩阵变成一个比较美的矩阵,而保证这两个矩阵都是描述了同一个线性变换。
我们首先回顾《高等代数》中关于二次型的一般理论. 设P是一个数域, aij?P, n个文字x1,x2,?,xn的二次齐次多项式
f(x1,x2,?,xn)?a11x12?2a12x1x2?2a13x1x3???2a1nx1xn
2 ?a22x2?2a23x2x3???2a2nx2xn
???
2 ?annxn
nn ???aijxixj (aij?aji,i,j?1,2,?,n)
i?1j?1称为数域P上的一个n元二次型, 简称二次型. 当aij为实数时, 称f为实二次型. 当
aij为复数时, 称f为复二次型. 如果二次型中只含有文字的平方项, 即
22 f(x1,x2,?,xn)?d1x12??d2x2???dnxn称f为标准型.
定义1.1 二次型f?(x1,x2,?,xn)可唯一的表示成
f(x1,x2,?,xn)?x?Ax
其中, x?(x1,x2,?,xn)?, A?(aij)n?n为对称矩阵, 称上式二次型的矩阵形式, 称A为二次型的矩阵(都是对称矩阵), 称A的秩为二次型f的秩.
定义1.2 设P是一个数域, cij?P, 两组文字x1,x2,?,xn;y1,y2,?,yn的关系式
?x1?c11y1?c12y2???c1nyn,?x?cy?cy???cy,?22112222nn ??????xn?cn1y1?cn2y2???cnnyn.称为由x1,x2,?,xn到y1,y2,?,yn的一个线性替换. 用矩阵形式可写为x?Cy,
其中x?(x1,x2,?,xn)?, C?(cij)n?n,y?(y1,y2,?,yn)?当C?0时称线性替换是非退化的(或可逆的, 或满秩的).
定义1.3 设是A,B是数域P上的n?n矩阵, 如果存在数域P上的可逆n?n矩阵C. 使B?C?AC, 则称A与B合同.
定义1.4 设Q(X)是n元实二次型. 如果对Rn中所有的X?0都有Q(X)?0, 就称
Q是正定的, 如果Rn中所有的X?0都有Q(X)?0, 就称Q是负定的, 如果对Rn中所
有的X?0都有Q(X)?0, 就称Q是半正定的, 如果对Rn中所有的X?0都有
Q(X)?0就称Q是半负定的.
定理1.1 n元实二次型f?X?TX(A是实对称矩阵, X?(x1,x2,?,xn)?)可以经过变量的正交变换X?QY(Q为正交阵), 化为f??1y1????nyn, 这里
22?i(i?1,2,?,n)是矩阵A的全部特征值.
定理 1.2 设n元实二次型f?X?TX, 则f在条件?xi2?1下的最大(小)值恰为矩
i?1n阵A的最大(小)特征值.
定理1.3 设A为n阶正定矩阵, X?(x1,x2,?,xn)?与??(c1,c2,?cn)?是实向量, ?为实数, 则实函数f(X)?X?AX?2??X??当X??A?1?时, 取得最小值????A?1?.
?A???X??1AA证明 f(X)??X?1??, 因正定, 所以存在(对称); 而 ?????????1?0?0?0??A???En0??A0?En?En??En?, ????A?11?, ????A?11??????????A?11??0????A?1??????A?11??????????????1因此
0??A0?E??Enf(X)??X?1??n?1??1??1????A??0????A???0A?1???X???? 1??1? =??X????A?10?A??X?A?1??1?? ??0????A?1???1???? = (X?A?1?)?A(X?A?1?)?????A?1? =Y?AY?(????A?1?)
其中Y?X?A?1?, 因A正定, 故当且仅当Y?0时, Y?AY取最小值0, 从而当且仅当
X??A?1?, f(x)取得最小值????A?1?.
2.1 一般的n元二次式的最值的判定与求法
一般的n元二次多项式的形式为
??aijxiyj?2?bixi?c
i?1j?1i?1nnn(2.1.1)
而(2.1.1)存在最值的充要条件为
??aijxiyj?2?bixi
i?1j?1i?1nnn(2.1.2)
存在最值(上式中aij?aji), 故只需要对(2.1.2)进行讨论.
定理2.1 实n元多项式(2.1.2), 它的矩阵为A, 秩为r, 对(2.1.2)作非退化的线性替换, X?PY, 其中
?EsP?AP???0??00?Er?s00?0??, 0??那么, (i) 当A半正定时;
1 若r?n, 则(2.1.2)存在最小值;
2 若r?n, 一次项所含新变数均在平方项中出现, 则(2.1.2)有最小值;
3 若r?n, 一次项所含新变数至少一个不在平方项中出现, 则(2.1.2)不存在最