第十六章

欧几里得空间和厄米特空间的谱定理

16.1引言

本章的目的是证明对称矩阵、斜对称矩阵、正交矩阵和正规矩阵都有很好的正规形式。对称矩阵的谱定理表明对称矩阵具有实特征值,并且它们可以在正交基上对角化。厄米特矩阵的谱定理表明,厄米特矩阵也有实特征值,并且它们可以在复正交基上对角化。正实矩阵可以在正交基上分块对角化,分块的大小最多为两个,这种正态形式对斜对称矩阵和正交矩阵有改进。

实对称矩阵的谱结果可以用来证明对称矩阵特征值在瑞利比方面的两种表征。第一个特征是瑞利-里兹定理,第二个特征是古兰-费希尔定理。这两个结果都被用于优化理论,并得到了对称矩阵特征值摄动的结果。

在本章中,所有向量空间都是有限维实向量空间或复向量空间。

16.2正态线性映射:特征值和特征向量

我们首先研究正态映射,以了解其特征值和特征向量的结构。这一部分和接下来的三个部分受到了lang[106]、Artin[7]、Mac Lane和Birkhoff[115]、Berger[11]和Bertin[15]的启发。

五百二十一

定义16.1.给定欧几里得空间e,线性映射f:e→e是正态的,如果

F F=F F.

线性映射f:e→e在f=f时为自伴,在f=-f时为斜自伴,在f f=f f=id时为正交。

显然,自伴、斜自伴或正交线性映射是正态线性映射。

地图。我们的第一个目标是证明对于每一个正态线性映射正交基(W.R.T.nice形式:它是一个块对角矩阵,其中块要么是一维的H−−−i),使得F在这个基上的矩阵有一个特别的yf:e→e,有一个

矩阵(即单个条目)或形式的二维矩阵

.

如果f是自伴、斜自伴或正交的,则可以进一步细化这种正规形式。作为第一步,我们展示了当f正常时f和f具有相同的内核。

提案16.1.给定欧几里得空间e,如果f:e→e是法向线性映射,则kerf=kerf。

证据。首先让我们证明一下

hf(u),f(v)i=hf(u),f(v)i

对于所有u,v∈e,因为f是f和f f=f f的伴随,我们有

hf(u),f(u)i=hu,(f(f)(u)i,=hu,(f f)(u)i,=hf(u),f(u)i.

因为H−,−I是正定的,

hf(u),f(u)i=0 iff(u)=0,hf(u),f(u)i=0 iff f(u)=0,

既然hf(u),f(u)i=hf(u),f(u)i,

我们有

f(u)=0 iff f(u)=0。

因此,切口=切口。

16.2。正态线性映射:特征值和特征向量

再次假设e是一个厄米空间,观察16.1号命题也成立。我们推论出以下推论。

提案16.2.给定一个厄米空间e,对于任意法向线性映射f:e→e,我们得到了ker(f)im(f)=(0)。

证据。假设v∈ker(f)im(f)=(0),这意味着对于某些u∈e,v=f(u),f(v)=0。根据命题16.1,ker(f)=ker(f),所以f(v)=0意味着f(v)=0。

因此,

0=hf(v),用户界面

=hv,f(u)i=hv,vi,

因此,v=0。

关于f和f的特征值,我们也有以下重要的命题。

提案16.3.给定一个厄米空间e,对于任意法向线性映射f:e→e,向量u是f的特征向量,对于特征值λ(在c中),如果u是f的特征向量,对于

img

特征值λ。

img

证据。首先,立即验证f−λid的伴随为f−λid。此外,f−λid是正常的。的确,

将命题16.1应用于f-λid,对于每个非空向量u,我们看到

img

(f−λid)(u)=0 iff(f−λid)(u)=0,

这正是这个命题的陈述。

下一个命题显示了正态线性映射的一个非常重要的性质:对应于不同特征值的特征向量是正交的。

提案16.4.给定厄米空间e,对于任意法向线性映射f:e→e,如果u和v是f的特征向量,与特征值λ和μ(在c中)相关,其中λ6=μ,则hu,vi=0。

证据。让我们用两种不同的方法计算hf(u),vi。从到对于,我们有v是f对于的特征向量,根据命题16.3,v也是

hf(u),vi=hλu,vi=λhu,vi,

和hf(u),v i=hu,f(v)i=hu,祆vi=祆hu,vi,

因为第二个论点的半线性,最后一个恒等式成立。因此

λhu,vi=μhu,vi,

也就是说,

(λ-μ)hu,vi=0,

这意味着hu,vi=0,因为λ6=μ。

我们可以很容易地证明自伴线性映射的特征值是实的。

提案16.5。给定一个厄米空间e,任意自伴线性映射f:e→e的特征值都是实的。

证据。设z(c)为f的特征值,u为z的特征向量。我们用两种不同的方法计算hf(u),ui。我们有

hf(u),ui=hzu,ui=zhu,ui,

既然f=f,我们也有

hf(u),u i=hu,f(u)i=hu,f(u)i=hu,zui=zhu,ui。

因此,朱,ui=朱,ui,

这意味着z=z,因为u 6=0,z确实是真实的。

对于(实)欧几里得空间e和自伴映射f:e→e,也有一个命题16.5的版本,因为每个实向量空间e都可以嵌入到一个复向量空间ec中,并且每个线性映射f:e→e可以扩展到一个线性映射fc:ec→ec。

定义16.2.加法运算给定一个实向量空间e,让ec为

(u1,u2)+(v1,v2)=(u1+v1,u2+v2)

并定义乘以复数标量z=x+iy

(x+iy)·(u,v)=(xu−yv,yu+xv)。

空间EC被称为e的复杂性。

16.2。正态线性映射:特征值和特征向量

结果表明,结构EC是一个复杂的矢量空间。也很快

(0,v)=i(v,0),

因此,用包含形式(u,0)所有向量的EC子空间来识别e,我们可以写

(u,v)=u+iv。

注意,如果(e1,…,en)是e(实向量空间)的基础,那么(e1,…,en)也是ec的基础(记住,ei是(ei,0)的缩写)。

将线性映射f:e→e扩展到线性映射fc:ec→ec,定义如下:

fc(u+iv)=f(u)+if(v)。

对于e的任何基(e1,…,en),表示f over(e1,…,en)的矩阵m(f)与表示fc over(e1,…,en)的矩阵m(fc)相同,我们将(e1,…,en)视为ec的基础。因此,det(zi−m(f))=det(zi−m(fc)),这意味着f和fc具有相同的特征多项式(具有实数系数)。我们知道,每一个具有实(或复)系数的n次多项式总是有n个复根(以其多重性计数),并且是实(如果有的话)的det(zi-m(fc))的根是f的特征值。

接下来,我们需要将E上的内部产品扩展到EC上的内部产品。

欧几里得空间E上的内积H−、−I扩展到欧几里得空间E上的厄米正定形式H−、−IC,如下所示:

hu1+iv1,u2+iv2ic=hu1,u2 i+hv1,v2i+i(hv1,u2i−hu1,v2i)。

很容易证明H−、−IC确实是一个正定的厄米形式,并且很明显H−、−、−IC在实向量上与H−、−I一致。然后给出任何线性映射f:e→e,很容易验证该映射定义如下:

fc(u+iv)=f(u)+if(v)

对于所有u,v∈e是fc w.r.t.h−、−ic的伴随。

提案16.6.给定欧几里得空间e,如果f:e→e是任意自伴线性映射,则fc的每一个特征值λ都是实的,实际上是f的一个特征值(即存在一些实的特征向量u∈e,因此f(u)=λu)。因此,f的所有特征值都是实的。

H−H−Proof.、−−IICLETON、IFEEF和CIS自伴,我们得到了C:EC的复杂性E、H−、−IC的复杂性内部产物F:E→E的复杂性。根据fc和

渐次

hfc(u1+iv1),u2+iv2ic=hf(u1)+if(v1),u2+iv2ic

=hf(u1),u2i+hf(v1),v2i+i(hu2,f(v1)i−hf(u1),v2i)

=hu1,f(u2)i+hv1,f(v2)i+i(hf(u2),v1i−hu1,f(v2)i)

=hu1+iv1,f(u2)+if(v2)ic=hu1+iv1,fc(u2+iv2)ic,

这表明fc也与h−、−ic自伴。

如前所述,f和fc具有相同的特征多项式det(zi-fc)=det(zi-f),这是一个具有实数系数的多项式。命题16.5表明,det(zi−ffc)=的零是奇异的,这意味着存在一些非零det(zi−f)都是实的,对于每个实零λ,线性映射λid−f(u)=λu。因此,f的所有特征值都是实的。

提案16.7。给定一个厄米空间e,对于任意线性映射f:e→e,如果f是偏态自伴,则f的特征值为纯虚数或零,如果f是幺正的,则f的特征值为绝对值1。

证据。如果f是斜自伴,f=−u与之相关,然后根据伴图的定义,对于λ,我们有任何特征值λ和任何特征向量。

img

λh u,u i=hλu,ui=h f(u),ui=hu,f(u)i=hu,−f(u)i=−hu,λui=−λhu,ui,由于u 6=0和h−,−i是正定的,hu,ui 6=0,所以

img

λ=−λ,

这表明,对于某些r∈r,λ=ir。

如果f是一元的,那么f是一个等距的,所以对于任何特征值λ和任何与λ相关的特征向量u,我们有

img

|λ2h u,u i=λhu,ui=hλu,λui=h f(u),f(u)i=hu,ui,

由于u 6=0,我们得到λ2=1,这意味着

|λ=1.

16.3正态线性映射的谱定理

对于欧几里得空间,有一些子空间,w实际上是w-eof维数1或2的一些实特征值的特征空间,因此,我们的下一步是证明对于每一个线性mapf(w)wf。此外,何时。当Dim(WF)=1:E→,关闭EIS

正常情况下,存在一个子空间,困难在于,维1或维2的w的特征值不一定是实的。绕过F(W)W和F(W)W的一种方法。

在第16.2节中有。这个问题是使向量空间e和内积h−i复杂化,正如我们

对于欧几里得空间e的任何子空间w,回想一下,w的正交补码w是子空间,其定义如下:

w=u∈e hu,wi=0,表示所有w∈w。

从命题11.11中可以回忆起,通过构造e=e的正交基,我们使用Gram–Schmidt正交归一化w(这可以很容易地显示,例如,程序)。同样的结果也适用于厄米提空间;见命题13.13。

作为定理16.12证明的热身,让我们证明欧几里得空间上的每个自伴映射都可以相对于特征向量的正交基对角化。

定理16.8。(欧几里得空间上自伴线性映射的谱定理)对于每个自伴线性映射f,给出了n的特征向量的维数(e1,…,en)的正态basis欧几里得空间e,这样矩阵就离开了:e→f ew.r.t。这

网络错误
网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

用λi∈r。

证据。我们对e的量纲n进行归纳,如下所示。如果n=1,结果是微不足道的。假设n≥2。从命题16.6出发,w的所有特征值都是λ的一些特征向量。将wf除以它的范数,是实的,因此选取一些特征值λ∈r,并让w是由w所跨越的维数1的子空间,我们可以假定w是单位向量。让

显然,f(w)w。我们声称f(w)w,其中w是w的正交补码。实际上,对于任何v∈w,也就是说,如果hv,wi=0,因为f是自伴的,f(w)=λw,

hf(v),w i=hv,f(w)i

=高压,λWi

=λhv,wi=0

因为hv,wi=0。因此,f(w)w。

显然,f对w的限制是自伴的,我们将归纳假设应用于w(其维数为n-1)。

现在我们回到正常的线性映射。定理16.8证明的一个关键点是,我们发现了一个子空间w,其性质是f(w)w表示f(w)w。一般来说,这种情况不会发生,但正态映射满足一个更强大的属性,从而确保存在这样的子空间。

下面的命题提供了一个条件,使我们能够证明一个正态线性映射可以对角化。它实际上适用于任何线性映射。我们在Berger[11]中找到了这个建议的灵感。

子空间布局16.9.(w)ww,然后是e,如果给定Hermitian空间f(w),则是e,用于任何线性映射。因此,iff:ef(→w)e和

证据。如果u w,那么所有w w的hw,ui=0。

然而,

hf(w),u i=hw,f(u)i,

而f(w)w表示f(w)w,由于u w,我们得到

0=hf(w),u i=hw,f(u)i,

表示f(w)w.hw,f(u)i=0表示所有w w,即f(u)w.因此,我们有

img

然后,通过应用上述事实,Towe证明,如果f(w)wf,那么我们得到f(w)(w)。如果我们也有,并且自f f(wf,这是)w,仅f(w)w,这证明了命题的第二个陈述。

显然,上述命题也适用于欧几里得空间。

尽管我们已经准备好证明,对于每一个法向线性映射f(在厄米空间上),都有一个特征向量的正交基(见下面的定理16.13),我们现在回到真正的欧几里德空间。

提案16.10。如果f:e→ze=λ是线性映射,且+iμ,其中u,v∈eWand=uλ,+iv∈是r的特征向量,则fc:ec→ec表示特征值。

f(u)=λu−μv和f(v)=μu+λv.()

因此,fc(u−i v)=f(u)−if(v)=(λ−iμ)(u−iv),

这表明w=u−iv是z=λ−iμ时fc的特征向量。

证据。因为fc(u+iv)=f(u)+if(v)

且fc(u+i v)=(λ+iμ)(u+iv)=λu−μv+i(μu+λv),

我们有

f(u)=λu−μv,f(v)=μu+λv。

利用这个事实,我们可以证明下面的命题。

提案16.11.给定欧几里得空间e,对于任意法向线性映射f:e→e,如果w=u+i v是与特征值z=λ+i礹(其中u,v∈e和λ,礹∈r)相关联的fc的特征向量,如果礹=06(即z不是实的),则hu,vi=0和hu,ui=hv,vi,这意味着u和v是线性无关的,如果w是u和v所跨越的子空间,那么f(w)=w和f(w)=w。此外,对于(正交)基(u,v),f到w的约束具有矩阵

.

如果μ=0,则λ是f的实特征值,u或v是λf的特征向量。如果w是由u表示的子空间,如果u=06,或如果u=0,用v=06表示的子空间,那么f(w)w和f(w)w。

证据。因为w=u+iv是fc的特征向量,根据定义,它是非空的,并且u=06或v=06。命题16.10意味着u−iv是λ−iμfc的特征向量。很容易检查fc是否正常。然而,如果μ=06,则λ+iμ=6λ−iμ,并且根据命题16.4,向量u+iv和u−iv是正交的w.r.t.h−、−ic,即,

hu+iv,u−ivic=hu,ui−hv,vi+2ihu,vi=0。

因此我们得到了hu,vi=0和hu,ui=hv,vi,由于u 6=0或v 6=0,u和v是线性无关的。自从

f(u)=λu−μv,f(v)=μu+λv

由于根据命题16.3,u+iv是λ−iμ的特征向量fc,我们得到

f(u)=λu+μv和f(v)=-μu+λv,

因此f(w)=w和f(w)=w,其中w是u和v所跨越的子空间。

当μ=0时,我们有

f(u)=λu和f(v)=λv,

由于u=06或v=06,u或v是λf的特征向量。如果w是u(u=06)所跨越的子空间,或者u(u=0)所跨越的子空间是v(v),那么很明显f(w)w和f(w)w是可能的。请注意,λ=0是可能的,这就是为什么不能替换为=。

命题16.11证明的开头实际上表明,对于每一个线性映射f:e→e,都有一些子空间w,这样f(w)w,其中w有维数1或2。一般来说,似乎不可能证明w在f下是不变的。然而,当f是正常的时候,这种情况就发生了。

我们终于可以证明我们的第一个主要定理。

定理16.12。(主谱定理)给定一个维数为n的欧几里得空间e,对于每一个法向线性映射f:e→e,都有一个正交基(e1,…,en),使得f w.r.t.的矩阵是形式的块对角矩阵。

网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

这样,每个块aj要么是一维矩阵(即实数标量),要么是二维形式的矩阵

式中,λj,μj∈r,其中μj>0。

证据。我们对e的量纲n进行归纳,如下所示。如果n=1,结果是微不足道的。假设n≥2。首先,由于c是代数闭的(即每个多项式在c中都有一个根),线性映射fc:ec→ec有一些特征值z=λ+i礹(其中λ,礹∈r)。设w=u+i v为λ+iμfc的某个特征向量(其中u,v∈e)。我们现在可以应用16.11号提案。

如果μ=0,则u或v是λ∈r的f的特征向量。如果u=06,则w是由e1=u/kuk或e1=v/kvk横跨的尺寸1的子空间。显然,f(w)w和f(w)w。w的正交w具有维数n-1,根据命题16.9,我们得到。但F对W的限制也是正常的,我们将诱导假设应用于W得出结论。

如果μ=06,那么hu,vi=0和hu,ui=hv,vi,如果w是u/kuk和v/kvk所跨越的子空间,那么f(w)=w和f(w)=w。我们也知道f对w的限制具有矩阵。

-

关于基础(u/kuk,v/kvk)。如果μ<0,我们设λ1=λ,μ1=−μ,e1=u/kuk,e2=v/kvk。如果μ>0,我们设λ1=λ,μ1=μ,e1=v/kvk,e2=u/kuk。在所有情况下,很容易证明f到w.r.t的约束矩阵。正交基(e1,e2)是

式中,λ1,μ1∈r,其中μ1>0。然而,w具有维度n-2,根据命题16.9,

. 由于F到W的限制也是正常的,因此我们通过应用

W的诱导假设。

经过这项比较艰苦的工作,我们可以很容易地得到自伴矩阵、斜自伴矩阵和正交线性映射矩阵的一些很好的正规形式。然而,为了完整性(既然我们有所有的工具可以这样做),我们回到厄米特空间的情况,证明了法向线性映射可以相对于正交基对角化。证明是定理16.6证明的一个小的推广。

定理16.13。(厄米空间上正态线性映射的谱定理)给出了一个尺寸为n的厄米空间e,对于每一个正态线性映射f:e→e,f的特征向量都有一个正交基(e1,…,en),因此f w.r.t.的矩阵就是这个基

网络错误
网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

式中,λj∈c。

证据。我们对e的量纲n进行归纳,如下所示。如果n=1,结果是微不足道的。假设n≥2。由于c是代数闭的(即每一个多项式在c中都有根),线性映射f:e→e有一些特征值λ∈c,并让w是λ的一些单位特征向量。设w为维1的子空间,用w表示。显然,f(w)w。

img

根据命题16.3,w是f对于λ的特征向量,因此f(w)w。根据命题16.9,我们也有f(w)w。f对w的限制仍然正常,我们将归纳假设应用于w(其维数为n-1)得出结论。

定理16.13暗示(复数)自伴、斜自伴和正交线性映射可以相对于特征向量的正交基对角化。但在后一种情况下,正交映射称为一元映射。命题16.5还证明了自伴线性映射的特征值是实的,命题16.7证明了歪斜自伴映射的特征值是纯虚的或零的,且一元映射的特征值是绝对值1。

注:与定理16.13相反,如果f的特征向量有一个正态基(e1,…,en),则f是正态的。我们把简单的证据留作练习。

在下一节中,我们将定理16.12专门化为自伴、斜自伴和正交线性映射。由于附加的结构,我们得到了更精确的正态形式。

16.4自伴图、斜自伴图和正交线性图

我们从自伴映射开始。

定理16.14。给定一个维数为n的欧几里德空间e,对于映射f:ef→w.r.t的每一个自伴线性矩阵,这个基是一个对角矩阵,f的特征向量有一个正交基(e1,…,en),使得

网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

式中,λi∈r。

证据。我们已经证明了这一点;见定理16.8。然而,给出一个不涉及H−、−I和命题16.5复杂性的更直接的方法是有指导意义的。

由于c是代数闭的,fc有一些特征值λ+i礹,并且让u+i v是16.10 fc的一些特征向量,对于λ+i礹,其中,λ,礹∈r和u,v∈e,我们在命题证明中看到

f(u)=λu−μv,f(v)=μu+λv。

因为f=f,hf(u),v i=hu,f(v)i

对于所有u,v∈e.应用于

f(u)=λu−μv和f(v)=μu+λv,

我们得到hf(u),vi=hλu-μv,vi=λhu,vi-μhv,vi

和hu,f(v)i=hu,μu+λvi=μhu,ui+λhu,vi,

因此我们得到了λhu,vi-μhv,vi=μhu,ui+λhu,vi,

即,μ(hu,ui+hv,vi)=0,

这意味着μ=0,因为u 6=0或v 6=0。因此,λ是f的实特征值。

现在回到定理16.12的证明,仅在μ=0适用的情况下,并且归纳显示所有块都是一维的。

定理16.14表明,如果λ1,…,λp是f的独特实特征值,ei是与λi相关的特征空间,那么

E=e1····ep,

其中,ei和ej对于所有i=6 j是正交的。

注:证明自伴映射具有真实特征值的另一种方法是使用一点微积分。我们从赫尔曼·格鲁克那里学到了这样一个证据。其思想是考虑实值函数Φ:e→r的定义如下:

Φ(u)=hf(u),ui

对于每一个u∈e,这个函数是c∞,如果我们用一个矩阵a在某个正交基上表示f,则很容易计算梯度向量。

img

是的,我们发现

Φ(x)=(a+a>)x,

其中x是大小为n的列向量。但由于f是自伴向量,a=a>,因此

Φ(x)=2ax.

下一步是求球面上函数Φ的最大值

.

由于sn−1紧凑且Φ连续,实际上c∞,因此,在sn−1上的某个x处,Φ取最大值。但众所周知,在Φ的极值x处,我们必须

dΦx(y)=hΦ(x),y i=0

对于x处的所有切线向量y到sn−1,因此Φ(x)与x处的切线平面正交。

X,也就是说

Φ(x)=λx

对于一些λ∈r,由于Φ(x)=2ax,我们得到

2ax=λx,

因此,λ/2是a(即f)的实特征值。

接下来我们考虑倾斜自伴映射。

定理16.15。给定一个维数为n的欧几里得空间e,对于每一个歪斜自伴

W.R.T.这个基是形式线性映射f:e→e的块对角矩阵,有一个正交基(e1,…,en),因此f的矩阵

网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

这样,每个块aj要么是0,要么是形式的二维矩阵

式中,μj∈orr,取0。μj>0.特别是,fc的特征值是形式为±iμ的纯虚值。

证据。n=1的情况是微不足道的。在定理16.12的证明中,fc有一些特征值z=λ+i礹,其中,λ,礹∈r,我们称之为λ=0。首先我们展示一下

hf(w),wi=0

对于所有的w∈e,事实上,既然f=−f,我们得到

hf(w),w i=hw,f(w)i=hw,−f(w)i=−hw,f(w)i=−hf(w),wi,

因为H−,−I是对称的。这意味着

hf(w),wi=0。

将此应用于u和v并使用以下事实:

f(u)=λu−μv和f(v)=μu+λv,

我们得到

0=hf(u),ui=hλu-μv,ui=λhu,ui-μhu,vi

0=hf(v),vi=hμu+λv,vi=μhu,vi+λhv,vi,

除此之外,我们从中

λ(hv,vi+hv,vi)=0.

由于u 6=0或v 6=0,我们得到λ=0。

然后回到定理16.12的证明,除非μ=0,否则u和v是正交的,并且跨度是维度2的子空间,并且归纳显示所有块都是二维的或减少到0。

备注:请注意,如果f是斜自伴,那么ifc是自伴w.r.t.h−、−ic。根据命题16.5,映射ifc具有实特征值,这意味着fc的特征值是纯虚的或0。

最后考虑正交线性映射。

定理16.16。给定一个维数为n的欧几里得空间e,对于每个正交线性映射f:e→e,都有一个正交基(e1,…,en),使得f w.r.t的矩阵。

这个基是块对角矩阵的形式

 

A1…

A2……γ

……………__

γ

…AP

使每个块aj要么是1、−1,要么是形式的二维矩阵

img

其中0<θj<π。特别是,fc的特征值的形式为cosθj±isinθj、1或−1。

证据。n=1的情况是微不足道的。立即证实f f=f f=id意味着fc fc=fc fc=id,因此地图fc是单一的。根据命题16.7,fc的特征值具有绝对值1。因此,fc的特征值的形式为cosθ±isinθ、1或−1。然后,定理紧接着从定理16.12开始,其中条件μ>0意味着sinθj>0,因此,0<θj<π。

显然,我们可以对定理给出的特征向量的正交基进行重新排序。

16.16,使f w.r.t.的矩阵,这个基是形式的块对角矩阵

 

A1…

……………γ

…ar

−智商…IP

其中每个块aj是一个二维旋转矩阵aj=6±i2的形式

img

0<θj<π。

线性映射f的特征值1的特征空间e(1,f)=k(f-id),特征值1的特征空间e(-1,f)=k(f+id)。如果det(f)=+1(f是一个旋转),e(−1,f)的尺寸q必须是偶数,并且−iq中的条目可以配对以形成二维块(如果我们愿意)。在这种情况下,so(n)中的每个旋转都有一个形式的矩阵

 

A1…

………………

…上午…在-2米

其中第一个M区AJ为

img

0<θj≤π。

定理16.16可用于证明卡坦-迪乌顿定理的一个版本。

定理16.17。设e为尺寸n≥2的欧几里得空间。对于每一个等距f∈o(e),如果p=dim(e(1,f))=dim(ker(f-id)),那么f是n-p反射的组成,n-p是最小的。

证据。根据定理16.16,有r个子空间f1,…,fr,维2中的每一个,这样

e=e(1,f)e(−1,f)f1··fr,

所有的顶点都是成对正交的。此外,f对每个fi的限制ri是一个旋转ri=6±id。每个2d旋转ri可以写成fi中关于线的两个反射si和S0i的组合(形成一个角度θi/2)。我们可以将si和s0i扩展到e中的超平面反射,使它们成为fi上的标识。然后

img

同意F1····fr上的f,并且是e(1,f)e(−1,f)上的标识。如果e(−1,f)有特征向量(v1,…,vq)的正态基,让S00j是关于超平面(vj)的反射,很明显

img

同意e(−1,f)上的f,并且是e(1,f)f1···fr.上的标识,但是

2r+q=n-p反射的组成。

如果

F=ST·····S1,

对于T反射Si,很明显

其中e(1,si)是定义反射si的超平面。根据格拉斯曼关系,如果我们与t≤n超平面相交,则它们相交的尺寸至少为n-t。因此,n-t≤p,即t≥n-p,n-p是构成f的最小反射数。

作为定理16.17的一个推论,我们得到如下事实:如果欧几里得空间e的维数n是奇数,那么每个旋转f∈so(e)都承认1为特征值。

证据。F的特征多项式DET(Xi—f)具有奇数阶n且具有实系数,因此必须具有实根根。由于f是一个等距测量,其n个特征值的形式为+1、−1和e±iθ,其中0<θ<π,因此λ=±1。现在特征值e±iθ出现在共轭对中,由于n是奇数,所以f的实特征值个数是奇数。这意味着+1是f的特征值,因为否则-1将是f的唯一实际特征值,并且由于它的多重性是奇数,我们将得到det(f)=-1,这与f是旋转的事实相矛盾。

当n=3时,得到了欧拉的结果,欧拉表示每一个三维旋转r都有一个不变的轴d,并且限制在与d正交的平面上,它是一个二维旋转。此外,如果(a,b,c)是定义旋转r轴d的单位向量,如果旋转角度是θ,如果b是斜对称矩阵

那么罗迪格斯公式(命题11.15)指出

r=i+sinθb+(1−cosθ)b2。

这一节和前一节的定理可以立即用矩阵来翻译。这些定理的矩阵形式经常用于应用中,因此我们在本节中简要介绍它们。

16.5正态矩阵和其他特殊矩阵

首先我们考虑实矩阵。回想一下以下定义。

定义16.3.给定一个实数m×n矩阵a,a的转置a>是n×m矩阵a>=(a>ij),定义如下:

A>IJ=AJ一

对于所有i,j,1≤i≤m,1≤j≤n,实n×n矩阵a是

• 正常中频

a a>=a>a,

• 对称中频

A>=A,

• 斜对称中频

A>=−A,

• 正交if

a a>=a>a=in.

从命题11.14可以回忆起,当e是欧几里得空间并且(e1,…,en)是e的正交基时,如果a是线性映射的矩阵f:e→e w.r.t。基(e1,…,en),那么a>是f的伴随f的矩阵。因此,正线性映射有一个正矩阵,一个自-a直线性映射具有对称矩阵,斜自伴线性映射具有斜对称矩阵,正交线性映射具有正交矩阵。

此外,如果(u1,…,un)是e的另一个正交基,p是基矩阵的变化,其列是ui w.r.t的组成部分。基(e1,…,en),则p是正交的,对于任何线性映射f:e→e,如果a是f w.r.t(e1,…,en)的矩阵,b是f w的矩阵。r.t.(u1,…,un),然后

B=P>AP。

因此,定理16.12和16.14–16.16可以重述如下。

16.5。正规矩阵和其他特殊矩阵

定理16.18。对于每一个正态矩阵a,都有一个正交矩阵p和一个块对角矩阵d,这样a=pd p>的形式为d。

 

D1…

d2…γ

D=……………__

γ

γ

……DP

这样,每个块dj要么是一维矩阵(即实数标量),要么是形式的二维矩阵

式中,λj,μj∈r,其中μj>0。

定理16.19。对于每个对称矩阵a,都有一个正交矩阵p和一个对角矩阵d,这样a=pd p>的形式为d。

式中,λi∈r。

定理16.20。对于每个斜对称矩阵a,都有一个正交矩阵p和一个块对角矩阵d,这样a=pd p>的形式为d。

img

这样,每个块dj要么是0,要么是形式的二维矩阵

式中:μj∈r,其中μj>0。特别地,a的特征值是形式为±iμj或0的纯虚数。

定理16.21。对于每个正交矩阵A,都有一个正交矩阵P和一个块对角矩阵D,这样a=p d p>的形式为d。

img

使每个块dj要么是1、−1,要么是形式的二维矩阵

img

其中0<θj<π。特别地,a的特征值的形式为cosθj±isinθj、1或−1。

定理16.21可用于证明指数图exp:so(n)→so(n)是可射的;见Gallier[73]。

我们现在考虑复杂矩阵。

定义16.4.给定一个复数m×n矩阵a,a的转置a>是n×m矩阵,定义如下:

img

img

对于所有i,j,1≤i≤m,1≤j≤n.a的共轭a是m×n矩阵a=(bij),定义如下:

bij=aij

对于所有的i,j,1≤i≤m,1≤j≤n。给定一个m×n复矩阵a,a的伴随a是定义如下的矩阵:

img

A=(A>)=(A)>。

A 复数n×n矩阵a是

• 正常中频

a a=a a,

• 赫米提安

A=A,

• 歪斜厄米提安如果

A=−A,

• 单一中频

a a=a a=英寸。

从命题13.15中回忆,当e是厄米空间并且(e1,…,en)是e的正交基时,如果a是线性映射的矩阵f:e→e w.r.t.基(e1,…,en),那么a是f的伴随f的矩阵。因此,正线性映射有一个正矩阵,一个自-伴随线性映射有一个厄米矩阵,一个斜自伴随线性映射有一个斜厄米矩阵,一个正线性映射有一个正矩阵。

此外,如果(u1,…,un)是e的另一个正交基,p是基矩阵的变化,其列是ui w.r.t的组成部分。基(e1,…,en),则p是单位的,对于任何线性映射f:e→e,如果a是f w.r.t(e1,…,en)的矩阵,b是f w.r.t的矩阵。(u1,…,un),然后

B =p ap.

定理16.13和命题16.7可以用矩阵的形式重述如下。

定理16.22。对于每一个复正规矩阵A,都有一个单位矩阵U和一个对角矩阵D,这样a=u d u。此外,如果a是厄米特矩阵,则d是实矩阵;如果a是斜厄米特矩阵,则d中的项是纯虚数或零;如果a是一元矩阵,则d中的项具有绝对值1。

16.6瑞利-里兹定理和特征值交错

在优化问题中经常使用的一个事实是,对称矩阵的特征值是用所谓的瑞利比来表征的,瑞利比由

.

以下命题通常用于证明各种优化或近似问题(例如PCA;见第21.4节)的正确性。它还用于证明命题16.25,用于证明图形绘制方法的正确性(见第19章)。

提案16.23。(Rayleigh–Ritz)如果a是特征值为λ1≤λ2≤····················································

img

(X=Un达到最大值),以及

img

(X=Un-K时达到最大值),其中1≤K≤N-1。等价地,如果vk是(u1,…,uk)所跨越的子空间,那么

img

证据。首先要注意

同样地,

.

由于A是一个对称矩阵,其特征值是实的,它可以相对于特征向量的正交基对角化,因此(u1,…,un)就是这样的基。如果我们写信

简单的计算表明

.

如果x>x=1,则=1,由于我们假设λ1≤λ2≤·································

.

因此,

由于这个最大值是为en=(0,0,…,1),我们得出结论

.

接下来观察x∈un−k+1,…,un和x>x=1 iff xn−k+1=·····=xn=0和

= 1。因此,对于这样一个x,我们有

.

因此,

由于在n−k位置为1时,en−k=(0,…,0,1,0,…,0)达到了这个最大值,我们得出结论:

如要求。

为了我们的目的,我们需要将命题16.23的版本应用于最小值而不是最大值,其证明是通过对命题16.23的证明进行细微修改而获得的。

提案16.24。(Rayleigh–Ritz)如果a是特征值为λ1≤λ2≤····················································

img

(X=U1的最小值),以及

img

(x=ui的最小值),其中2≤i≤n.相等,如果表示(uk,…,un)所跨越的子空间(v0=(0)),则

img

命题16.23和16.24一起被称为瑞利-里兹定理。

作为命题16.23和16.24的应用,我们证明了一个命题,它允许我们比较两个对称矩阵a和b=r>ar的特征值,其中r是满足方程r>r=i的矩形矩阵。

首先,我们需要一个定义。

定义16.5.给定n×n对称矩阵a和m×m对称b,m≤n,如果λ1≤λ2≤············································

B的特征值,那么我们说B的特征值与中频的特征值交错。

λi≤μi≤λn−m+i,i=1,…,m.

例如,如果n=5,m=3,我们有

λ1≤礹1≤λ3λ2≤礹2≤λ4λ3≤礹3≤λ5。

提案16.25。设a为n×n对称矩阵,r为n×m矩阵,r>r=i(m≤n),b=r>ar(m×m矩阵)。以下属性保留:

(a) B的特征值与A的特征值交错。

(b) 如果λ1≤λ2≤··································································

证据。(a)设(u1,…,un)为a的特征向量的正态基,设(v1,…,vm)为b的特征向量的正态基,设uj为(u1,…,uj)所跨越的子空间,设vj为(v1,…,vj)所跨越的子空间。对于任何i,子空间vi的维数为i,而子空间r>ui-1的维数最多为i-1。因此,存在一些非零向量v∈vi(r>ui-1),并且

v>r>uj=(rv)>uj=0,j=1,…,i−1,

我们有RV∈(ui−1)。根据16.24号提案,利用R>R=I的事实,我们得出

.

另一方面,根据第16.23号提案,

所以

对于所有w∈vi,

既然v∈vi,我们有

img

我们可以对对称矩阵−a和−b应用相同的参数,得出如下结论:

-λn−m+i≤−μi,

也就是说,

μi≤λn−m+i,i=1,…,m.

因此,λi≤μi≤λn−m+i,i=1,…,m,

根据需要。

(b)如果λi=μi,则

所以v必须是b的特征向量,rv必须是a的特征向量,两者都是特征值λi=μi。

命题16.25立即暗示了庞加莱分离定理。它可以用于量子力学等情况,在量子力学中,人们有关于内积u>i auj的信息。

提案16.26。(Poincar’e分离定理)设a为n×n对称(或厄米特)矩阵,设r为1≤r≤n的整数,设(u1,…,ur)为r正交向量。设b=(u>i auj)(r×r矩阵),设λ1(a)≤…≤λn(a)是a和λ1(b)的特征值≤…≤λr(b)是b的特征值;然后我们得到

λk(a)≤λk(b)≤λk+n−r(a),k=1,…,r.

注意16.25号提案意味着

λ1+····+λm≤tr(r>ar)≤λn−m+1+····+λn。

如果p1是通过删除其最后一列从单位矩阵中获得的n×(n-1)矩阵,我们就得到了,并且矩阵是通过删除其最后一行和最后一列从a中获得的矩阵。在这种情况下,交错结果是

λ1≤μ1≤λ2≤μ2≤·······································

真正的交错。我们通过删除单位矩阵的最后n−r列得到的矩阵pn−r得到了类似的结果,并且设置是通过删除其最后n−r行和列从a获得的r×r矩阵。在这种情况下,我们有以下交错不等式,称为柯西交错定理:

λk≤μk≤λk+n−r,k=1,…,r.()

16.7古兰-费希尔定理;扰动结果

证明特征值相等性的另一个有用工具是对称矩阵特征值的Courant-Fischer特征,也称为最小-最大(和最大-最小)定理。

定理16.27。(courant–fischer)设a为特征值为λ1≤λ2≤··········································

img

证据。让我们考虑第二个等式,第一个等式的证明是相似的。设(u1,…,un)为a特征向量的任何正交基,其中ui是与λi相关联的单位特征向量。观察(u1,…,uk)所跨越的空间vk有维k,根据命题16.23,我们得到

.

因此,我们需要证明逆不等式,也就是说,我们必须证明

,对于所有w∈vk。

对于任何w∈vk,如果我们能证明=(0),那么对于任何非零,

根据16.24号提案,我们

.

仍然需要证明这一点。然而,dim(vk−1)=k−1,因此dim(n−k+1,假设dim(w)=k。根据格拉斯曼关系,

昏暗的

因为dim(dim(rn)=n,我们得到

K+N−K+1≤尺寸(;

也就是说,1≤dim(),如权利要求所述。

柯朗-费歇尔定理给出了以下有用的结果,即由于赫尔曼-韦尔的存在而使对称矩阵的特征值受到扰动。

16.7。古兰-费歇尔定理;摄动结果

提案16.28。给定两个n×n对称矩阵a和b=a+∆a,如果α1≤α2≤

···αn为a的特征值,β1≤β2≤·····≤βn为b的特征值,则

|αk−βk≤ρ(∆a)≤k∆ak2,k=1,…,n.

证据。将vk定义为courant–fischer定理中的定义,并将vk定义为与λ1,…,λk相关联的k特征向量所跨越的子空间。根据应用于b的courant–fischer定理,我们得到

.

根据16.23号提案,我们

所以我们得到

img

现在,根据16.23号提案和8.9号提案,我们已经

式中,λi(∆a)表示∆a的第i个特征值,这意味着

βk≤αk+ρ(∆a)≤αk+k∆ak2。

通过交换A和B的角色,我们也有

αk≤βk+ρ(∆a)≤βk+k∆ak2,

因此,

|αk−βk≤ρ(∆a)≤k∆ak2,k=1,…,n,

如要求。

命题16.28也适用于厄米特矩阵。

威兰特和霍夫曼的一个很好的结论是

其中k kf是frobenius规范。然而,证明比上述证明要困难得多;见LAX[110]。

柯南-费歇尔定理也可以用来证明由于赫尔曼-韦尔而产生的一些著名的不等式。这些也可以看作是扰动结果。给定两个对称(或厄米特)矩阵a和b,让λi(a)、λi(b)和λi(a+b)分别表示a、b和a+b的第i个特征值,按非递减顺序排列。

提案16.29。(weyl)给定两个对称(或厄米提安)n×n矩阵a和b,下列不等式成立:对于1≤i,j,k≤n的所有i,j,k:

1. 如果i+j=k+1,则λi(a)+λj(b)≤λk(a+b)。

2. 如果i+j=k+n,那么

λk(a+b)≤λi(a)+λj(b)。

证据。注意,第一组不等式是通过将A替换为−A和B替换为−B从第二组获得的,因此足以证明第二组不等式。根据courant–fischer定理,存在一个维度n−k+1的子空间h,这样

.

同样地,存在维度i的子空间f和维度j的子空间g,这样

.

我们声称f g h=(0)6.为了证明这一点,我们使用了两次格拉斯曼关系。首先,dim(f g h)=dim(f)+dim(g h)−dim(f+(g h))≥dim(f)+dim(g h)−n,

其次,

尺寸(g h)=dim(g)+dim(h)−dim(g+h)≥dim(g)+dim(h)−n,

所以

尺寸(F G H)≥尺寸(F)+尺寸(G)+尺寸(H)−2N。

16.8。总结

然而,dim(f)+dim(g)+dim(h)=i+j+n−k+1

i+j=k+n,所以我们有dim(f g h)≥i+j+n−k+1−2n=k+n+n−k+1−2n=1,

这表明f g h=(0)6.那么对于任何单位向量z∈f g h 6=(0),我们得到

λk(a+b)≤z>(a+b)z,λi(a)≥z>az,λj(b)≥z>bz,

建立期望的不等式λk(a+b)≤λi(a)+λj(b)。

在特殊情况下,i=j=k,得到λ1(a)+λ1(b)≤λ1(a+b),λn(a+b)≤λn(a)+λn(b)。

因此,λ1(作为函数)是凹的,而λn(作为函数)是凸的。如果i=1和j=k,我们得到

λ1(a)+λk(b)≤λk(a+b),

如果i=k,j=n,我们得到

λk(a+b)≤λk(a)+λn(b),

结合起来,我们得到

λ1(a)+λk(b)≤λk(a+b)≤λk(a)+λn(b)。

特别地,如果b是正半定的,由于它的特征值是非负的,我们得到了对称(或厄米特)矩阵的单调性定理:如果a和b是对称的(或厄米特),b是正半定的,那么

λk(a)≤λk(a+b)k=1,…,N.

读者可以参考Horn和Johnson[92](第4章和第7章),了解矩阵不等式和交错结果的完全处理,以及LAX[110]和SERRE。

[ 151 ]。

16.8总结

本章的主要概念和结果如下:

• 正态线性映射、自伴线性映射、倾斜自伴线性映射和正交线性映射。

• 正态线性映射特征值和特征向量的性质。

• 实向量空间、线性映射和欧几里得内部的复杂性

• 厄米空间中自伴映射的特征值是实的。

• 欧氏空间中自伴映射的特征值是实的。

• 欧几里得空间上的每一个自伴线性映射都有一个本征向量的正交基。

• 欧几里得空间上的每一个正态线性映射都可以相对于特征向量的正态基进行块对角化(块的大小最多为2×2)。•Hermitian空间上的每个法向线性图都可以相对于特征向量的非正态基对角化。•自伴、斜自伴和正交线性映射(欧几里得空间)的谱定理。•正态、对称、斜对称和正交(实)矩阵的谱定理。•正规矩阵、厄米特矩阵、斜厄米特矩阵和幺正(复)矩阵的谱定理。

• 瑞利比和瑞利-里兹定理。

• 交错不等式和柯西交错定理。

• 庞加莱分离定理。

• 古兰-费舍尔定理。

• 涉及对称矩阵特征值摄动的不等式。

• 韦尔不等式。

16.9问题

问题16.1。证明定义16.2中引入的结构ec确实是一个复杂的向量空间。

问题16.2。证明公式

hu1+iv1,u2+iv2ic=hu1,u2 i+hv1,v2i+i(hv1,u2i−hu1,v2i)

在EC上定义一个厄米形式,它是正定的,在实向量上,H−、−、−IC与H−、−I一致。

问题16.3。给出任何线性映射f:e→e,证明该映射fc定义如下:

img

对于所有u,v∈e是fc w.r.t.h−、−ic的伴随。

问题16.4。设A为特征值非负的实对称n×n矩阵。证明了当p>0时,存在一个特征值为非负的实对称矩阵S,即sp=a。

问题16.5。设A为特征值为正的实对称n×n矩阵。

(1)证明了存在一个实对称矩阵S,这样a=es。

(2)设为实对称n×n矩阵。证明了a=es是一个实对称n×n矩阵,其特征值为正。

问题16.6.设A为复杂矩阵。证明如果a可以相对于正交基对角化,则a是正态的。

问题16.7。设f:cn→cn为线性图。

(1) 证明如果f是可对角化的,如果λ1,…,则λn是f的特征值,则是f2的特征值,如果λ2i=λ2j意味着λi=λj,则f和f2具有相同的特征空间。

(2) 设f和g为两个实自伴线性映射f,g:rn→rn。证明如果f和g具有非负特征值(f和g是半正定的),如果f=g2,则f=g。

问题16.8。(1)设so(3)为3×3斜对称矩阵的空间

所以。

对于任何矩阵

如果我们让θ=√a2+b2+c2,从第11.7节(罗德里格斯公式)中回忆,指数图exp:so(3)→so(3)由下式给出:

,如果θ=06,

其中exp(03)=i3。

(2) 证明e a是行列式+1的正交矩阵,即旋转矩阵。

(3) 证明指数图exp:so(3)→so(3)是可预测的。为此,按如下步骤进行:选取任意旋转矩阵r∈so(3);

(1) 案例r=i是微不足道的。

(2) 如果r=6 i且tr(r)=6−1,则

.

(回想一下,tr(r)=r11+r22+r33,矩阵r的轨迹)。

结果表明,存在一个独特的斜对称b,其相应的θ满足0<θ<π,使得eb=r。

(3) 如果r=6 i且tr(r)=−1,则证明r的特征值是1、−1、−1、r=r>和r2=i。证明矩阵

img

是特征值为−1、−1,0的对称矩阵。因此,s可以相对于正交矩阵q对角化为

.

证明存在一个斜对称矩阵

img

以便

注意

由此得出结论,如果u2=s,那么b2+c2+d2=1。那么展示一下

其中(b,c,d)是任何单位向量,因此对于相应的斜对称矩阵u,我们有u2=s。

(4)为了找到一个斜对称矩阵u,如(3)所示,我们可以

解决系统问题

img

我们立即得到b2,c2,d2,然后,因为b,c,d中的一个不为零,比如b,如果我们选择b2的正平方根,我们可以从bc和bd中确定c和d。

在Matlab中实现一个计算机程序来解决上述问题。

问题16.9。在14.15号命题中证明了指数映射是一个映射exp:so(n)→so(n),其中so(n)是实n×n次对称矩阵的向量空间。利用谱定理证明了映射exp:so(n)→so(n)是可射的。

问题16.10。设u(n)为(复数)n×n斜厄米特矩阵(b)的空间=

)它的子空间是由具有零迹的斜厄米特矩阵构成的

(1) 证明如果b∈u(n),那么eb∈u(n),如果b∈su(n),那么eb∈su(n)。因此,我们有定义良好的映射exp:u(n)→u(n)和exp:su(n)→su(n)。

(2) 证明地图exp:u(n)→u(n)是主观的。

(3) 证明地图exp:su(n)→su(n)是推测性的。

问题16.11。回想一下,如果b>=-b,矩阵b∈mn(r)是斜对称的。检查斜对称矩阵的集合so(n)是维度n(n−1)/2的向量空间,因此与rn(n−1)/2同构。

(1) 给定旋转矩阵

其中0<θ<π,证明存在一个斜对称矩阵b,这样

R=(I−B)(I+B)−1.

(2) 证明了斜对称矩阵的特征值为0或纯虚数(即,形式为μ∈r的iμ)。

设c:so(n)→mn(r)为函数(称为b的凯莱变换),由

C(B)=(I−B)(I+B)−1.

证明如果b是斜对称的,那么i-b和i+b是可逆的,因此c是定义良好的。证明这一点

(i+b)(i-b)=(i-b)(i+b)

还有那个

(i+b)(i-b)−1=(i-b)−1(i+b)。

证明这一点

(c(b))>c(b)=i

且该DETC(b)=+1,

所以c(b)是一个旋转矩阵。此外,证明c(b)不承认−1为特征值。

(3) 设为n×n旋转矩阵组。证明地图

C:所以(n)→所以(n)

双射到不承认-1为特征值的旋转矩阵的子集上。显示此图的反方向由

B=(I+R)−1(I−R)=(I−R)(I+R)−1,

其中r∈so(n)不承认−1为特征值。

问题16.12。请参阅问题??设λ1,…,λn为a的特征值(不一定不同)。利用舒尔定理,a类似于上三角矩阵b,即a=pbp−1和b上三角,我们可以假设b的对角项按降序为λ1,…,λn。

(1) 如果EIJ是根据

和J>K

(i,j)<(h,k)iff

.

证明Rb是一个上三角矩阵,其对角项为

LB是一个上三角矩阵,其对角项是

.

暗示。找出什么是rb(eij)=eijb和lb(eij)=beij。

(2) 利用这个事实

la=lp lb l−p1,ra=rp−1 rb rp,

用lb−rb表示Ada=la−ra,得出Ada的特征值为λi−λj,i=1,…,n,j=n,…,1。