矩阵理论中的几个重要不等式及证明
摘要:本文主要对矩阵理论中的Cauchy-Schwarz不等式、Hadamard不等
式、Kantorovich不等式、Neumann不等式等4个不等式进行介绍和证明,并简要说明其主要的应用领域。
关键词:矩阵不等式 Cauchy-Schwarz Hadamard Kantorovich Neumann 1.引言
随着矩阵理论的迅速发展及其在自然科学、工程技术和社会经济等领域的广泛应用,关于矩阵不等式的新结果层出不穷,它们多数是经典不等式的改进或推广,基于此,本文旨在对矩阵理论的4个重要不等式进行介绍和简要证明。
2.Cauchy-Schwarz不等式
Cauchy-Schwarz不等式是一个非常基本的不等式,也是一个经常被使用的不等式,鉴于它的重要性,本文首先对其进行介绍。
Cauchy-Schwarz不等式:设x,y?Cn,则
|(x,y)|2?(x,x)?(y,y)
等号成立当且仅当x与y线性相关。
证明:当x或y有一个为零向量时,|(x,y)|?(x,x)?(y,y)?0,结论显然成立。当x,y?0时,则对任意的??C,有:
(x??y,x??y)?(x,x)??(y,x)??(x,y)???(x,x)?0
(x,y)在上式中取??,得:
(y,y)(x??y,x??y)?(x,x)??(y,x)??(x,y)???(y,y)(x,y)(x,y)(x,y)(x,y)(y,x)?(x,y)?(y,y) (y,y)(y,y)(y,y)2(x,y)?(x,x)?(y,x)?0(y,y)?(x,x)?整理即得:
(x,y)(y,x)?(x,x)(y,y)
即
|(x,y)|2?(x,x)?(y,y)
等号成立当且仅当x??y?0,即x与y线性相关。
特殊的,当A为n阶正定Hermite矩阵时,由矩阵分解知识知,存在正线上三角矩阵R,使得A?RHR,令u?Rx,v?Ry,对u和v使用Cauchy-Schwarz不等式,即:
|(Rx,Ry)|2?(Rx,Rx)?(Ry,Ry)
另外
(Rx,Ry)?xHRHRy?xHAy?(x,Ay)
同理
(Rx,Rx)?(x,Ax),(Ry,Ry)?(x,Ay)
于是可得不等式:
|(x,Ay)|2?(x,Ax)?(y,Ay)
同样,等号成立当且仅当x与y线性相关时。
同样,当A为n阶正定Hermite矩阵时,令u?A1/2x,v?A?1/2y时,对u和v使用Cauchy-Schwarz不等式,可得不等式:
|(x,y)|2?(x,Ax)?(y,A?1y)
同样,等号成立当且仅当x与y线性相关时。
Cauchy-Schwarz不等式对于矩阵的理论分析研究非常重要,例如在矩阵的特征值估计、在统计线性模型参数估计、证明内积性质和概率论的方差及协方差性质时都要用到。
3.Hadamard不等式
对于正定矩阵,Hadamard不等式是一个很基本的不等式,根据它可以推出许多其他不等式,Hadamard不等式的具体形式主要有以下两种: (1) 设A 为n阶半正定Hermite矩阵,则:
det(A)??aii
i?1n(2) 设A?(aij)?Cn?n,则:
?n?n?2?|?i(A)|?|det(A)|?????|aij|?? ?i?1????i?1?j?1?n1/2证明:首先证明Hadamard不等式的第一种形式。 令D?diag(d1,d2,,dn),di?aii?1/2,i?1,2,,n,则: 易知bij?0,bii?aii?1/2?aii?aii?1/2于是证明
det(A)??aii
i?1nB?DAD ?1,i?1,2,,n
等价于证明
det(B)?1
记?i(B)(i?1,2,,n)为B的特征值,应用算术平均与几何平均不等式,得:
?1n??1?det(B)???i(B)????i(B)???tr(B)??1
??ni?1??ni?1且等号成立当且仅当所有?i(B)?1,因为B也是Hermite阵,所以等号成立当且仅当B为单位矩阵E,这等价于A为对角阵。
再来证明Hadamard不等式的第二种形式,显然矩阵AAH是半正定Hermite矩阵,且对角元为:
nnn(AA)ii??aij?aij??|aij|2,i?1,2,Hj?1j?1nn,n
另外
det(AAH)?det(A)?det(AH)?det(A)?det(A)?det(A)?det(A)?|det(A)|2 于是对矩阵AAH使用Hadamard不等式的第一种形式,得:
nn?n2HH2?|det(A)|?det(AA)??(AA)ii????|aij|?
i?1i?1?j?1?从而结论得证。等号成立条件是AAH为对角阵或某对角元为0,即矩阵A的列向量两两正交或某列向量为零向量。
Hadamard不等式的几何意义是欧拉空间中n维超平形体的体积不超过各条棱具有相同长度的超长方体的体积,并且相等的充要条件是棱向量两两正交。
4.Kantorovich不等式
Kantorovich不等式:设A 为n阶正定Hermite矩阵,其特征值为
?1??2???n?0,?1,?2,,?n为其对应的标准正交化特征向量,则对任意非零向量x?Cn,有:
(x,Ax)(x,A?1x)(?1??n)2 1??2(x,x)4?1?n且当x?(?1??n)/2时,右边等号成立
证明:设A 为n阶正定Hermite矩阵,在Cauchy-Schwarz不等式的推广形式中,已证明如下不等式:
|(x,y)|2?(x,Ax)?(y,A?1y)
特别当x?y时
(x,x)2?(x,Ax)?(x,A?1x)
等价地,对任意x?0
(x,Ax)(x,A?1x) 1?2(x,x)Kantorovich不等式左半部分得到证明。
设D?diag(?1,?2,,?n),由于A 为Hermite矩阵,所以A也为正规矩阵,根据正规矩阵分解定理,存在酉矩阵U,使得A?UHDU。
记y?Ux,则:
?n??i?|yi|/??|yi|2?,i?1,2,?i?1?2,n
显然,?i?0,??i?1。
i?1n(x,Ax)(x,A?1x)xHUHDUxxHUHD?1Ux?(x,x)2(xHUHUx)2yHDyyHD?1y?H?yyyHyn1?n2?2??|y|?|y|??ii????i?
????i?1ni??i?1n?2??2?|y||y|??i???i??i?1??i?1??n??n?i?????i?i??????i?1??i?1?i?于是,Kantorovich不等式的证明变成了证明如下不等式:
?n??n?i?(?1??n)2 ??ii?????????4???i?1??i?1i?1n定义ui和vi(i?1,2,,n)如下:
??i??1ui??nvi?1 ?11?u????i?vi1n?i容易验证,ui?0和vi?0,i?1,2,,n,于是:
1??vi????1ui??nvi??i?n???1
2uv(???)2??ui?vi??ii1n1?i???1ui?1?1?n可推得ui?vi?1,i?1,2,记
,n
nu???iui
i?1nv???ivi
i?1则有
u?v???i(ui?vi)???i?1
i?1i?1nn可得
4uv??u?v??1
2于是
?n??n?i???i?i??????i?1??i?1i??n?1??n1?(?u??v)??(u?v)????1i?nii???i?nii???i?1?1??i?111?(?1u??nv)?(u?v)?1?n??u?v??24uv(?1??n)4?1?n2
(?1??n)2(?1??n)2?1??4?1?n4?1?n从而Kantorovich不等式的右半部分得到证明,容易验证x?(?1??n)/2时,等号成立。
另一方面,Kantorovich不等式的可改写为:
(x,x)2?(x,Ax)?(x,A?1x)
(?1??n)2(x,Ax)(x,Ax)?(x,x)2
4?1?n?1从这个意义上说,Kantorovich不等式左半部分是Cauchy-Schwarz不等式,右半部分是Cauchy-Schwarz不等式的逆形式。
Kantorovich不等式主要用于统计学里的参数估计和相对效率的研究、最优化理论的最速下降法中。例如,在统计学中,它在最小二乘估计的精度和效率及在广义相关系数中有着重要的应用;而在最速下降法中,它可以刻画其收敛速度。
5.Neumann不等式
Neumann不等式:设A和B为两个n阶Hermite矩阵,它们的特征值分别为?1??2???n和?1??2???n,?1,?2,,?n为A的特征值对应的标准正交化特征向量,则
???ii?1nnn?i?1?tr(AB)???i?i
i?1nn并且左边等号成立当且仅当B???n?i?1?i?iH,而右边等号成立当且仅当
i?1B???i?i?iH。
i?1证明:记??(?1,?2,故可分解为
,?n),D?diag(?1,?2,A??HD?。
,?n),因A为Hermite矩阵,
根据tr(AB)?tr(BA),有: