特征向量和特征值

第十四章

特征向量和特征值

在本章中，所有向量空间都是在一个任意的k域上定义的。为了具体起见，读者可以安全地假设k=r或k=c。

14.1线性图的特征向量和特征值

给定一个有限维向量空间e，让f:e→e是任意线性映射。如果幸运的话，有一个e的基（e1，…，en），f用对角矩阵表示。

，

那么f对e的作用很简单，在每个方向上，我们都有

f（ei）=λiei。

我们可以把f看作是沿着e1，…，en方向拉伸或收缩空间的变换（至少如果e是一个实向量空间）。就矩阵而言，上述性质转化为存在可逆矩阵p和对角矩阵d的事实，这样矩阵a可以被分解为

A=PDP−1。

当这种情况发生时，我们说f（或a）是可对角化的，λi称为f的特征值，ei是f的特征向量。例如，我们将看到每个对称矩阵都可以对角化。不幸的是，并非每个矩阵都可以对角化。例如，矩阵

不能对角化。有时矩阵不能对角化，因为它的特征值不属于系数域，例如

，

其特征值为？。这不是一个严重的问题，因为a2可以在复数上对角化。然而，A1是一个“致命”的案例！实际上，它的特征值都是1，问题是A1没有足够的特征向量来跨越E。

第二件最好的事情是有一个基础，关于这个基础，F由一个上三角矩阵表示。在这种情况下，我们说f可以三角化，或者f可以三角化。如我们在14.2节中所看到的，如果f的所有特征值都属于系数k的域，那么f可以被三角化。特别是，如果k=c，情况就是这样。

现在三角化的一个替代方法是考虑F对两个基（e1，…，en）和（f1，…，fn）的表示，而不是单个基。在这种情况下，如果k=r或k=c，我们甚至可以把这些碱基选为正交，得到一个带非负项的对角矩阵∑，这样

f（ei）=σi f i，1≤i≤n。

非零的σi是f的奇异值，相应的表示是奇异值分解（SVD）。SVD在应用中起着非常重要的作用，将在第20章中详细讨论。

在本节中，我们将重点讨论对角化线性映射的可能性，并引入相关的概念。给定一个向量空间e在一个域k上，让id表示e上的单位映射。

在无限维空间e上定义的线性映射f:e→e的特征值概念非常微妙，因为它不能像在有限维情况下那样用特征向量来定义。问题是，映射λid−f（带有λ∈c）可能是不可逆的（因为它不是可射的），但却是可内射的。在有限维中，这是不可能发生的，所以在进一步注意之前，我们假定e是有限维n。

定义14.1.给定任意有限维的向量空间e和任意线性映射f:e→

e，如果存在非零向量u∈e，则称为f的特征值或适当值，或特征值。

f（u）=λu。

等价地，如果ker（λid−f）是非平凡的（即，ker（λid−f）=6 0）iffλid−f是不可逆的，则λ是f的特征值（这是使用e是有限维的事实；如果e是可逆的，则从e到自身的线性映射是内射的）。如果u=06并且有一些λ∈k，那么向量u∈e被称为特征向量，或适当向量，或f的特征向量，这样

f（u）=λu；

标量λ是特征值，我们说u是与λ相关联的特征向量。在给定特征值λ∈k的情况下，非平凡子空间ker（λid−f）由与λ相关联的所有特征向量和零向量组成；该子空间用eλ（f）或e（λ，f）表示，甚至用eλ表示，称为与λ相关联的特征空间，或适当的与wi相关联的子空间。Th。

注意，不同的特征向量可能对应于相同的特征值，但不同的特征值对应于不相交的特征向量集。

备注：正如我们在定义8.4之后的备注中强调的，我们要求特征向量非零。这一要求似乎比不便有更多的好处，尽管它可能被认为有点不雅，因为与特征值相关的所有特征向量集不是子空间，因为零向量被排除在外。

下一个命题表明，线性映射f:e→e的特征值是与f相关联的多项式的根。

提案14.1.设e为有限维n的任意向量空间，设f为任意线性映射f:e→e，f的特征值为多项式的根（k）。

det（λid−f）。

证据。一个标量λ∈k是f的特征值，如果e中有一些向量u=06，那么

f（u）=λu

敌我识别

（λid−f）（u）=0

iff（λid−f）不可逆iff，根据命题6.14，

det（λid−f）=0。

鉴于多项式det（λid−f）的重要性，我们有以下定义。

定义14.2.给定维数n的任意向量空间e，对于任何线性映射f，e，多项式PF（x）＝χF（x）＝x（x）＝f f，称为f的特征多项式，对于任意一个方阵A，多项式PA（x）＝χA（x）＝a（XI）a被称为A的特征多项式。

注意，我们已经在第6.7节中遇到了特征多项式；见定义6.9。

给定任何基（e1，…，en），如果a=m（f）是f w.r.t.（e1，…，en）的矩阵，我们可以通过展开下列行列式计算f的特征多项式χf（x）=det（x id−f）：

如果我们展开这个行列式，我们会发现

χa（x）＝DET（Xi＝a）＝Xn＝（A11+Fe·+ANN）Xn＝1＋＋＋（1）n DET（a）。

a的对角元素的和tr（a）=a11+························································p是定义良好的；对于表示f的任何矩阵a，我们都有tr（f）=tr（a）。

注：线性映射的特征多项式有时被定义为DET（F-X ID）。因为det（f−x id）=（−1）n det（x id−f），

这基本上没有区别，但版本DET（x id−f）的小优点是xn的系数为+1。

如果我们写出χa（x）＝Dt（Xi＝a）＝xn＝1（a）xn＝1＋＋＋（1）kλk（a）xn＝k+ω＋（（1）n）n（a），则我们证明了

τ1（a）=Tr（a）和τn（a）=Det（a）。

也可以用A的某些子矩阵的行列式表示τk（a）。对于任何非空子集，i 1，…，n，假设i i1<…<i k，让a i，i是a的k×k子矩阵，其jth列由元素a i h ij组成，其中h=1，…，k。相当地，ai，i是从a中获得的矩阵，首先选择索引属于i的列，然后选择索引也属于i的行。然后可以显示

τk（a）=x det（a i，i）。

I I1=，…，NK

如果多项式DET（XI—A）的所有根，La 1，…，LaMn都属于字段k，那么我们可以写。

χa（x）＝DET（Xi＝a）＝（xλ1）··（xλn）；

其中一些λi可能出现多次。因此，χa（x）＝DeT（Xi＝a）＝Xn＝α1（λ）xn＝1＋＋＋（1）k×kλk（λ）xn＝k+ω+（（1）n）n（λ），

式中，σk（λ）=x yλi，

i i1=，…，nk i∈i

λi的第k个初等对称多项式（或函数），其中λ=（λ1，…，λn）。初等对称多项式σk（λ）通常表示为Ek（λ），但这种表示法在线性代数中可能会混淆。对于n=5，基本对称多项式如下：

σ0（λ）=1σ1（λ）=λ1+λ2+λ3+λ4+λ5σ2（λ）=λ1λ2+λ1λ3+λ1λ4+λ1λ5+λ2λ3+λ2λ4+λ2λ5

+λ3λ4+λ3λ5+λ4λ5σ3（λ）=λ3λ4λ5+λ2λ4λ5+λ2λ3λ5+λ2λ3λ3λ3λ4+λ1λ4λ5

+λ1λ3λ5+λ1λ3λ4+λ1λ2λ5+λ1λ2λ4+λ1λ2λ3σ4（λ）=λ1λ2λ3λ4+λ1λ2λ5+λ1λ2λ5+λ1λ1+λ1λ5+λ1λ1λ5+λ1λ3λ4λ5+λ2λ3λ3λ4λ5（λ）=λ1λ2λ3λ4λ5。

自从

，

我们有σk（λ）=τk（a），k=1，…，n，

特别地，f的特征值的乘积等于det（a）=det（f），f的特征值之和等于f的迹tr（a）=tr（f）；对于记录，

Tr（f）=λ1+·····+λn Det（f）=λ1···························

其中，λ1，…，λn是f（和a）的特征值，其中一些λi可能出现多次。特别是，当f承认0有特征值时，f是不可逆的（因为f是奇异的iffλ1··································

注：根据场k，特征多项式χa（x）＝DET（Xi－a）可能在K.中有根或可能不存在根，这促使考虑代数闭域，即域k，使得k中的每个多项式在K.都有其根，例如在k= r，而不是EVE。Ry多项式有实根。如果我们考虑矩阵

，

然后，特征多项式DET（Xi—A）不存在实根，除非Th＝Kπ。然而，在复数域C上，每个多项式都有根。例如，上面的矩阵的根cosθ±isinθ=e±iθ。

注：可以证明在复向量空间e上的每一个线性映射f都必须有一些（复）特征值，而无需借助于行列式（和特征多项式）。设n=dim（e），选取任意非零向量u∈e，并考虑序列

u，f（u），f2（u），…，fn（u）。

因为上面的序列有n+1个向量，e有维数n，这些向量必须是线性相关的，所以有一些复数c0，…，cm，而不是全部为零，这样

c0fm（u）+c1fm−1（u）+···+cmu=0，

其中m≤n是最大整数，因此fm（u）的系数为非零（m必须存在，因为我们有一个非平凡的线性依赖关系）。因为场C是代数闭的，所以多项式

c0xm+c1xm−1+····+cm

可以写成线性因子的乘积

c0xm+c1xm−1+····+cm=c0（x−λ1）···（x−λm）

对于一些复数，λ1，…，λm∈c，不一定是不同的。但既然c0=06，

c0fm（u）+c1fm−1（u）+···+cmu=0

等于

（f-λ1 id）····（f-λm id）（u）=0.

如果所有的线性映射f-λi id都是内射的，那么（f-λ1 id）····（f-λm id）将是内射的，这与u=06的事实相矛盾。因此，一些线性映射f-λi id必须具有一个非平凡的核，这意味着存在一些v=06，因此

f（v）=λiv；

也就是说，λi是f的特征值，v是f的特征向量。

虽然上面的论点很好，但它没有提供一种求f特征值的方法，即使我们更喜欢尽可能避免行列式，我们也不得不处理特征多项式det（x id−f）。

定义14.3.设A是域k上的n×n矩阵，假设A的特征多项式χa（x）＝DET（Xi—a）的所有根属于k，这意味着我们可以写出DET（Xi＝a）＝（xλ1）k1··（xλm）km，

其中，δ1，…，αm k是DET（Xi—A）和K1+Fo.+Km＝n的不同的根。整数Ki被称为特征值LaMi的代数多重性，而特征空间E-εI＝KER（SigiII- A）的维数被称为Li的几何多重性。用alg表示的λi的合法性（λi），用geo表示的几何重数（λi）。

根据定义，代数重数之和等于n，但几何重数之和可以严格地更小。

提案14.2.设A是域k上的n×n矩阵，假设A的特征多项式χa（x）＝DET（Xi—a）的根全部为k。λi的几何多重性总是小于或等于其代数多重性，即Geo（λi）ωλi（λi）。

证据。要知道这一点，如果ni是与特征值λi相关的特征空间eλi的维数，我们可以通过选取eλi的基并将这个线性独立的族完善为kn的基来形成kn的基。关于这个新的基础，我们的矩阵是

，

简单的行列式计算表明

DET（Xi-A）＝DET（Xi＝A0）＝（xλi）Ni-DET（辛-Ni-D）。

因此，（x−λi）ni划分a0的特征多项式，因此a的特征多项式。由此得出ni小于或等于λi的代数重数。

下面的命题显示了一个有趣的特征空间特性。

提案14.3.设e为有限维n的任意向量空间，设f为任意线性映射。如果u1，…，um是与成对的特征值相关联的特征向量，那么族（u1，…，um）是线性无关的。

证据。假设（u1，…，um）是线性相关的。然后存在μ1，…，μk∈k，使得μ1ui1+····+μkuik=0，

其中1≤k≤m，μi=06对于所有i，1≤i≤k，i1，…，ik 1，…，m，并且（ui1，…，uik）的任何适当子族均不具有线性依赖性（换句话说，我们考虑与k最小的依赖关系）。将f应用于这个依赖关系，我们得到

礹1λi1ui1+····+礹kλikuik=0，

如果我们将原始依赖关系乘以λi1并从上面减去它，我们得到μ2（λi2−λi1）ui2+···+μk（λik−λi1）uik=0，

这是（ui1，…，uik）的适当子族之间的非平凡线性依赖关系，因为λj都是不同的，而μi是非零的，这是一个矛盾。

作为14.3号命题的推论，我们得到了以下结果。

推论14.4。如果λ1，…，λm都是f的成对特征值（其中m≤n），我们有一个直接和

Eλ1··Eλm

特征空间的eλi。

不幸的是，情况并非总是这样

E=Eλ1···Eλm.

定义14.4.什么时候？

e=eλ1···eλm，

我们说f是可对角化的（对于任何与f相关的矩阵也是如此）。

实际上，在每个eλi中选取一个基，我们得到一个由特征值组成的对角矩阵，每个λi发生的次数等于eλi的维数。如果每个特征值的代数重数和几何重数相等，就会发生这种情况。特别地，当特征多项式有n个不同的根时，则f是可对角化的。也可以证明对称矩阵具有实特征值，可以对角化。

对于一个否定的例子，我们把它作为练习来表示矩阵

不能对角化，即使1是特征值。问题是1的特征空间只有维数1。矩阵

也不能对角化，因为它没有真正的特征值，除非θ=kπ。然而，在复数域中，它可以对角化。

14.2。还原为上三角形

14.2还原为上三角形

不幸的是，并非复杂向量空间上的所有线性映射都可以对角化。第二个最好的方法是“三角化”，这意味着找到一个基础，在此基础上，矩阵在主对角线下有零个条目。幸运的是，这种基础总是存在的。

我们说一个正方形矩阵A是一个上三角矩阵，如果它有以下形状的话，

网络错误网络错误网络错误网络错误网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误网络错误

定理14.5。给出了K域上任意有限维向量空间，对于任意线性映射f:e→e，有一个基（u1，…，un），f由上三角矩阵（mn（k））表示，f的所有特征值都属于k。等价地，对于每一个n×n矩阵a∈mn（k），其中is可逆矩阵p和上三角矩阵t（均以mn（k）表示），因此

A=PTP−1

如果a的所有特征值都属于k。

证据。如果有一个基（u1，…，un），用上三角矩阵t表示f（mn（k），那么由于f的特征值是t的对角项，所以f的所有特征值都属于k。

网络错误
	网络错误网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误

反过来，我们对e的维数n进行归纳，对于n=1，结果是明显的。如果n>1，假设f的特征值都是k，选取f的某个特征值λ1∈k，并使u1成为相应的（非零）特征向量。我们可以找到n−1矢量（v2，…，vn），这样（u1，v2，…，vn）是e的基础，让f是（v2，…，vn）所跨越的维度n−1的子空间。在基（u1，v2…，vn）中，f的矩阵为

因为其第一列包含基础上的λ1U1坐标（U1，V2，…，VN）。如果我们让p:e→f是定义的投影，当2≤i≤n时，p（u1）=0和p（vi）=vi，定义为p f对f的限制的线性映射g:f→f由（n-1）×（n-1）矩阵v=（aij）2≤i，j≤n表示在基（v2，…，vn）。我们需要证明G的所有特征值都属于K，但是，由于U的第一列有一个非零的入口，我们得到

χu（x）＝DET（Xi＝u）＝（x＝λ1）DET（Xi＝v）＝（xλ1）χv（x），

其中，χu（x）是u的特征多项式，χv（x）是v的特征多项式。由此可知，χv（x）除以χu（x），由于χu（x）的所有根都在k中，因此所有的χv（x）的根也都在k中，因此我们可以应用归纳假设，f有一个基（u2，…，un），使得g由一个上三角矩阵表示。

（bij）1≤i，j≤n-1。然而，

e=ku1 f，

因此（u1，…，un）是e的基础，因为p是e=ku1 f到f的投影，g:f→f是p f到f的限制，我们有

F（U1）=λ1U1

和

对于一些a1i∈k，当1≤i≤n−1。但是关于（u1，…，un）的f矩阵是上三角形的。

对于矩阵形式，我们假设a是关于某个基的f矩阵，然后我们证明了基矩阵p的变化，使得a=ptp−1，其中t是上三角形。

如果a=ptp−1，其中t是上三角形，注意t的对角线项是a的特征值λ1，…，λn。实际上，a和t具有相同的特征多项式。另外，如果a是一个特征值都是实的实矩阵，那么p可以选为实的；如果a是一个特征值都是有理的有理矩阵，那么p可以选为有理的。因为C上的任何多项式都有C的根，所以定理14.5意味着每个复杂的n×n矩阵都可以三角化。

如果e是一个厄米空间（见第13章），定理14.5的证明可以很容易地适应，以证明f的矩阵是上三角的正态基（u1，…，un）。这通常被称为舒尔引理。

定理14.6。（舒尔分解）给定复厄米空间e上的任何线性映射f:e→e，存在一个正交基（u1，…，un），f由上三角矩阵表示。等价地，对于每个n×n矩阵a∈mn（c），都有一个单位矩阵u和一个上三角矩阵t，使得

A=UTU。

14.2。还原为上三角形

如果a是实的并且它的所有特征值都是实的，那么就有一个正交矩阵q和一个实的上三角矩阵t，这样

A=qtq>。

证据。在归纳过程中，我们选择f作为cu1的正交补码，并选取正交碱基（使用命题13.13和13.12）。如果e是一个实欧几里得空间，如果f的特征值都是实的，证明也通过实矩阵（使用命题11.11和11.10）。

如果λ是矩阵A的特征值，如果u是与λ关联的特征向量，则从

Au=λu，

我们得到

a2u=a（au）=a（λu）=λau=λ2u，

这表明λ2是特征向量u的a2的特征值。一个明显的归纳表明，对于所有k≥1的特征向量u，λk是ak的特征值。现在，如果a的所有特征值λ1，…，λn都在k中，那么这就是ak的特征值。然而，AK没有其他特征值并不明显。事实上，这是不可能发生的，这可以用定理14.5证明。

提案14.7.给定任意n×n矩阵a∈mn（k）在k域中的系数，如果a的所有特征值λ1，…，λn都在k域中，那么对于每个多项式q（x）∈k[x]，q（a）的特征值都是（q（λ1），…，q（λn））。

证据。根据定理14.5，有一个上三角矩阵t和一个可逆矩阵p（均以mn（k）表示），这样

A=PTP−1。

由于A和T是相似的，它们具有相同的特征值（具有相同的多重性），因此T的对角线项是A的特征值。

ak=ptkp−1，k≥1，

对于任何多项式q（x）=c0xm+····+cm−1X+cm，我们有

q（a）=c0am+·····+cm−1a+cmi

=c0ptmp−1+·····+cm−1ptp−1+cmpip−1

=P（c0tm+·····+cm−1t+cmi）P−1=PQ（t）P−1。

此外，很容易看出q（t）是上三角形，其对角线项是q（λ1）、…、q（λn），其中，λ1、…、λn是t的对角线项，即a的特征值，由此得出q（λ1）、…、q（λn）是q（a）的特征值。

注：还有另一种方法证明14.7命题不使用定理14.5，

但实际上，对于任何一个k域，都存在k（k k）的场扩展k，使得系数ci∈k的每一个多项式q（x）=c0xm+····+cm−1x+cm（阶数m≥1）作为

q（x）=c0（x−α1）···（x−αn），αi∈k，i=1，…，n.

场k称为代数闭场（和k的代数闭包）。

假设a的所有特征值λ1，…，λn都属于k。让q（x）是任意多项式。

（在k[x]中），并让祄∈k为q（a）的任何特征值（这意味着祄是

特征多项式χq（a）（x）∈q（a）的k[x]。因为k是代数闭的，所以χq（a）（x）

根植于K）。我们认为，对于A的某个特征值λi，μ=q（λi）。

证据。（在LAX[110]之后，第6章）。由于k是代数闭合的，多项式的−q（x）因子为−q（x）=c0（x−α1）···（x−αn），

对于一些αi∈k，现在μi−q（a）是mn（k）中的矩阵，由于μ是q（a）的特征值，所以它必须是奇异的。我们有

μi−q（a）=c0（a−α1i）···（a−αni）

因为左边是奇异的，右边也是，这意味着某个因子a−αii是奇异的。这意味着αi是a的特征值，例如αi=λi。由于αi=λi是μ−q（x）的零点，我们得到μ=q（λi）。

证明了对于A的某个特征值λi，μ确实是q（λi）的形式。

利用定理14.6，我们可以得到两个非常重要的结果。

提案14.8.如果a是一个厄米矩阵（即a=a），那么它的特征值是实的，a可以相对于特征向量的正交基对角化。在矩阵项中，有一个单位矩阵u和一个实对角矩阵d，因此a=udu。如果a是实对称矩阵（即a>=a），则其特征值是实的，a可以相对于特征向量的正交基对角化。在矩阵项中，有一个正交矩阵q和一个实对角矩阵d，因此a=qdq>。

证据。根据定理14.6，我们可以写出a=utu，其中t=（tij）是上三角形，并且

u是一个单位矩阵。如果a=a，我们得到

UTU=UT U，

这意味着t=t。因为t是上三角矩阵，所以t是下三角矩阵，这意味着t是对角矩阵。此外，由于t=t，我们有

14.3。特征值的位置

t i i=tii代表i=1，…，n，这意味着tii是真实的，所以t实际上是一个真实的对角矩阵，比如d。

如果我们把这个结果应用于（实）对称矩阵A，我们就得到了对称矩阵的所有特征值都是实的事实，并且再次应用定理14.6，我们得出了a=q d q>，其中q是正交的，d是实对角矩阵。

第16章证明了14.8号提案的更一般版本。

当实矩阵A具有复杂的特征值时，定理14.6的一个版本只涉及实矩阵，前提是我们允许t是块上三角形（对角线条目可以是2×2矩阵或实条目）。

定理14.6不是一个非常实际的结果，但它是一个有用的理论结果，可以处理不能对角化的矩阵。例如，它可以用来证明每一个复矩阵都是具有不同特征值的对角化矩阵序列的极限！

14.3特征值的位置

如果a是n×n复数（或实数）矩阵a，那么即使粗略地知道a的特征值在复平面c中的位置也很有用。Gershgorin圆盘提供了一些有关这一点的精确信息。

定义14.5.对于任意复数n×n矩阵a，i=1，…，n，let

让

每个圆盘z∈c z−aii≤ri0（a）称为Gershgorin圆盘，其联合G（a）称为Gershgorin域。Gershgorin域的示例如图14.1所示。

虽然很容易证明，但以下定理非常有用：

定理14.9.（格什戈林圆盘定理）对于任何复杂的n×n矩阵a，a的所有特征值都属于格什戈林域g（a）。此外，以下属性保持不变：

图14.1：假设a是定义14.5末尾指定的3×3矩阵。对于这个特殊的a，我们发现它=10，和=15。蓝色/紫色圆盘为Z 1 5，粉色圆盘为Z I 10，桃盘为Z 1 I 15，G（A）是这三个圆盘的结合。

(1) 如果a是严格的对角占优行，那就是

，对于i=1，…，n，

那么a是可逆的。

(2) 如果a是严格的行对角占优，如果a i i>0，对于i=1，…，n，那么a的每个特征值都有严格的正实部。

证据。设λ为a的任何特征值，设u为相应的特征向量（记住必须有u=0）6。设k为这样一个索引：

| UK=最大Ui。

1≤I≤N

因为au=λu，我们有

，

这意味着

14.3。特征值的位置

由于u=06且uk=max1≤i≤n ui，我们必须有uk 6=0，因此

，

因此

，

如要求。

(1) 严格的行对角优势意味着0不属于任何Gershgorin圆盘，因此a的所有特征值都是非零的，a是可逆的。

(2) 如果a是严格的行对角占优，并且a i i>0，对于i=1，…，n，那么每个gershgorin圆盘都严格地位于右半平面，因此a的每个特征值都有严格的正实部。

特别地，定理14.9意味着，如果对称矩阵严格地是行对角占优的，并且有严格的正对角项，那么它就是正定的。定理14.9有时被称为格什戈林-阿达玛定理。

由于a和a>具有相同的特征值（即使对于复杂矩阵），我们也有一个关于半径圆盘的定理14.9的版本。

，

其域g（a>）由

图14.2所示。

因此，我们得出以下结论：

定理14.10。对于任意复n×n矩阵a，a的所有特征值都属于格氏域g（a）g（a>）的交集。见图14.3。此外，以下属性保持不变：

(1) 如果A是严格的对角占优列，那就是

，对于j=1，…，n，

那么a是可逆的。

图14.2：假设a是定义14.5末尾指定的3×3矩阵。对于这个特殊的a，我们发现它=10，和=9。淡蓝色圆盘为Z 1 1，粉色圆盘为Z I 10，赭石圆盘为Z 1 I 9，G（A>）是这三个圆盘的结合。

(2) 如果a是严格的列对角占优，如果a i i>0，对于i=1，…，n，那么a的每个特征值都有严格的正实部。

Gershgorin定理和特征值定位结果的改进涉及除圆盘之外的其他领域；有关此主题的更多信息，请参见Horn和Johnson[92]第6.1和6.2节。

注：可逆性既不需要严格的行对角优势，也不需要严格的列对角优势。此外，如果我们把所有严格的不等式都放宽为不等式，那么行对角优势（或列对角优势）并不是可逆性的充分条件。

14.4特征值问题的处理

以下n×n矩阵

零

10_

 

10_

A=…

10_

1 0

14.4。特征值问题的条件

图14.3：假设a是定义14.5末尾指定的3×3矩阵。尘土飞扬的玫瑰地区是G（A）G（A>）。

具有多重性n的特征值0。但是，如果我们扰动的最右上入口，很容易看出矩阵的特征多项式

是。因此，如果n=40和）的特征值为10−1ek2πi/40，k=1，…，40。因此，我们看到矩阵A的一个非常小的变化（）导致A的特征值发生显著变化（从0到10−1ek2πi/40）。实际上，相对误差是10-39。更糟糕的是，由于机器的精度，由于非常小的数字被视为0，因此计算特征值（例如，矩阵A（10-40））时的误差可能非常大。

这种现象类似于第8.5节讨论的现象，我们研究了线性系统系数ax=b的小扰动对其解的影响。在第8.5节中，我们看到线性系统在小扰动下的行为受矩阵a的条件数cond（a）的控制。在特征值问题（求矩阵的特征值）的情况下，我们将看到问题的条件取决于条件n。将矩阵A简化为对角线形式d=p−1ap时使用的基矩阵p变化的数量，而不是A本身的条件数。我们假设a是对角化的，并且矩阵范数k k满足一个特殊条件（p=1,2，∞的算符范数k kp满足），这是由Bauer和Fike（1960）提出的。

提案14.11.设a∈mn（c）为对角化矩阵，p为可逆矩阵，d为对角矩阵d=diag（λ1，…，λn），使

A=PDP−1，

设k k为矩阵范数，这样

kdiag（α1，…，αn）k=最大αi，

1≤I≤N

对于每个对角线矩阵。然后对于每个扰动矩阵∆a，如果我们写

bi=z∈c z−λi≤cond（p）k∆ak，

对于a+∆a的每个特征值λ，我们有

证据。设λ为矩阵A+的任一特征值∆a。如果某些j的λ=λj，则结果很小。因此，假设j=1，…，n的λ=6λj。在这种情况下，矩阵d−λi是可逆的（因为j=1，…，n的特征值是λ−λj），我们得到

p−1（a+∆a−λi）p=d−λi+p−1（∆a）p

=（d−λi）（i+（d−λi）−1p−1（∆a）p）。

由于λ是A+的特征值，因此矩阵A+α-λi是奇异的，因此矩阵

i+（d−λi）−1p−1（∆a）p

也必须是单数。根据8.11（2）号提案，我们

，

既然k是矩阵范数，

，

所以我们有

现在（d−λi）−1是一个带有条目1/（λi−λ）的对角矩阵，因此根据我们对范数的假设，

14.5。矩阵指数特征值

因此，由于存在一些指数k，mini（λi−λ）=λk−λ，因此我们得出

，

我们得到

=康德（P）k∆ak，

这证明了我们的结果。

命题14.11意味着，对于任何可对角化矩阵A，如果我们用

（a）=inf cond（p）p−1ap=d，

然后，对于a+∆a的每个特征值λ，我们得到

定义14.6.数字（a）=inf cond（p）p−1ap=d被称为相对于特征值问题的条件作用。

如果a是一个正规矩阵，因为根据定理16.22，a可以对一个单位矩阵u进行对角化，因为对于谱范数kuk2=1，我们看到_（a）=1。因此，正态矩阵有很好的条件，即特征值问题。事实上，对于A+∆A（有法向）的每个特征值λ，我们有

如果A和A+∆A都是对称的（或厄米提安），则结果更为明显；见命题16.28。

注意，矩阵）从节的开始是不正常的。

14.5矩阵指数特征值

根据矩阵A的特征值，舒尔分解得到了矩阵指数ea的特征值的一个刻画。首先我们有以下的命题。

提案14.12。设A和U为（实数或复数）矩阵，并假定U是可逆的。然后，euau−1=ueau−1。

证据。一个简单的归纳法表明

uapu−1=（uau−1）p，

因此

如要求。

提案14.13.对于任意一个复n×n矩阵a，如果λ1，…，λn是a的特征值，那么eλ1，…，eλn是ea的特征值。此外，如果u是λi的a的特征向量，那么u是eλi的ea的特征向量。

证据。根据定理14.5，有一个可逆矩阵p和一个上三角矩阵t，这样

A=PTP−1。

根据14.12号提案，EPTP−1=PET P−1。

是上三角形，因为tp是所有p≥0的上三角形。如果

λ1，λ2，…，λn是t的对角项，矩阵乘法的性质与p上的归纳相结合，说明tp的对角项是。这反过来意味着，1的对角线项≤i≤n。因为

A和T是相似的矩阵，我们知道它们具有相同的特征值，即t的对角线项λ1，…，λn。由于ea=eptp−1=p et p−1，et是上三角形，因此我们使用相同的论点得出结论，ea和et都具有相同的特征值，即f et，其中et的对角项的形式为eλ1，…，eλn。现在，如果u是a的特征值λ的特征向量，简单归纳表明u是a的特征值λn的特征向量，由此得出：

这表明u是eλ的ea的特征向量。

因此，我们得到以下结果。

14.6。总结

提案14.14.对于每一个复（或实）平方矩阵A，我们有

det（ea）=etr（a）、

式中，tr（a）是a的迹线，即其对角线项的和a11+·····+ann。

证据。矩阵a的迹等于a的特征值之和。矩阵的行列式等于其特征值的乘积，如果λ1，…，则λn是a的特征值，那么根据命题14.13，eλ1，…，eλn是ea的特征值，因此

，

根据需要。

如果b是一个斜对称矩阵，由于tr（b）=0，我们推断det（eb）=e0=1。这样我们就可以得到以下结果。回想一下，斜对称矩阵的（实）向量空间用so（n）表示。

提案14.15。对于每一个斜对称矩阵b∈so（n），我们都有eb∈so（n），也就是说，eb是一个旋转。

证据。根据命题8.23，eb是一个正交矩阵。由于tr（b）=0，我们推断det（eb）=e0=1。因此，eb∈so（n）。

命题14.15表明，图b→7 eb是图exp:so（n）→so（n）。它不是内射的，但可以（使用光谱定理之一）证明它是可射的。

如果b是（实）对称矩阵，那么

（eb）>=eb>=eb，

所以电子束也是对称的。由于b的特征值λ1，…，λn是实的，根据命题14.13，由于eb的特征值是eλ1，…，eλn和λi是实的，所以i=1，…，n的eλi>0，这意味着eb是对称正定的。事实上，可以证明，对于每一个对称正定矩阵A，都有一个唯一的对称矩阵B，使得a=eb；参见Gallier[73]。

14.6总结

本章的主要概念和结果如下：

• 对角矩阵。

• 特征值，特征向量；与特征值相关的特征空间。

• 特征多项式。

• 痕迹。

• 代数和几何多重性。

• 与不同特征值相关的特征空间形成一个直接和（命题14.3）。

• 把一个矩阵简化成一个上三角矩阵。

• 舒尔分解。

• 格什戈林的圆盘可用于定位复杂矩阵的特征值；见定理14.9和14.10。

• 特征值问题的条件。

• 矩阵指数的特征值。公式det（ea）=etr（a）。

14.7问题

问题14.1。设A为以下2×2矩阵

(1) 证明A的特征值为0，重数为2，而a2=0。

(2) 设A为任意实数2×2矩阵

证明如果bc>0，那么a有两个不同的实特征值。证明如果a，b，c，d>0，那么有一个正的特征向量u与a的两个特征值中最大的一个相关，这意味着如果u=（u1，u2），那么u1>0和u2>0。

(3) 假设A是任意复杂的2×2矩阵，如（2）所示。证明如果a的特征值为0，且其重数为2，则a2=0。证明如果a是实对称的，那么a=0。

问题14.2。设A为任意复数n×n矩阵。证明如果a的特征值为0，且具有多重性n，则a=0。举一个矩阵A的例子，其中a=0但a=0.6

问题14.3。设a为2×2矩阵的复数，设λ1和λ2为

a.证明如果λ1=6λ2，则

问题14.4.设A为实对称2×2矩阵

(1) 证明a的特征值是实的，并由

(2) 当且仅当b=0且a=c时，证明a具有双特征值（λ1=λ2=a）；即a是对角矩阵。

(3) 证明了A的特征值是非负的iff b2≤a c和a+c≥0。

(4) 证明了A的特征值是正的iff b20，c>0。

问题14.5。求矩阵的特征值

检查a+b的特征值不等于a+b的特征值之和。

问题14.6.设a为实对称n×n矩阵，b为实对称正定n×n矩阵。我们要解决广义特征值问题：求λ∈r和u=06，这样

au=λbu.（）

(1) 用Cholseky分解b=cc>证明，λ和u是广义特征值问题（）的解，iffλ和v是（普通）特征值问题的解。

c−1a（c>）−1v=λv，其中v=c>u。

检查C−1a（c>）−1是否对称。

(2) 证明当u1=λ1bu1，au2=λ2b2，且u1=06，u2 6=0，λ1=6λ2时，则u>1 bu2=0。

(3) 证明b−1a和c−1a（c>）−1具有相同的特征值。

问题14.7.斐波那契数列，0,1,1,2,3,5,8,13,21,34,55，…，由递推给出。

Fn+2=Fn+1+Fn，

f0=0，f1=1。以矩阵形式，我们可以写

(1) 展示一下

(2) 证明矩阵的特征值

是

号码

被称为黄金分割率。表明a的特征值为和−-1。（3）证明a的对角线为

证明这一点

因此

问题14.8.设A为N×N矩阵。对于1，…，n，让a i，i是从a中获得的矩阵，首先选择索引属于i的列，然后选择索引也属于i的行。证明

τk（a）=x det（a i，i）。

I I1=，…，NK

问题14.9.（1）考虑矩阵

证明a的特征多项式χa（z）=det（zi-a）由下式给出

χa（z）=z3+a1z2+a2z+a3。

(2) 考虑矩阵

证明a的特征多项式χa（z）=det（zi-a）由下式给出

χa（z）=Z4+A1Z3+A2Z2+A3Z+A4。

(3) 考虑n×n矩阵（称为伴随矩阵）

网络错误网络错误网络错误网络错误网络错误网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误网络错误

证明a的特征多项式χa（z）=det（zi-a）由下式给出

χa（z）=zn+a1zn−1+a2zn−2+·····+an−1z+an。

暗示。使用感应。

解释为什么找到多项式的根（具有实系数或复系数）和找到（实系数或复系数）矩阵的特征值是等价的问题，从这个意义上说，如果我们有一种方法来解决其中一个问题，那么我们就有一种方法来解决另一个问题。

问题14.10。设A为一个复数n×n矩阵。证明如果a是可逆的并且a的特征值是（λ1，…，λn），那么a−1的特征值是（λ−1，…，λ−n1）。证明如果u是λi的a的特征向量，那么u是λ−i 1的−1的特征向量。

问题14.11.证明了每一个复矩阵都是特征值不同的对角化矩阵序列的极限。

问题14.12。考虑以下三对角n×n矩阵

网络错误网络错误网络错误网络错误网络错误网络错误网络错误	网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误网络错误网络错误网络错误

观察a=2i−s，表明a的特征值为λk=2−μk，其中μk是s的特征值。

(2) 利用问题9.6，证明矩阵A的特征值由

证明A是对称正定的。

(3) 求a相对于2-范数的条件数。

(4) 证明与特征值λk相关联的特征向量（）由下式给出：

问题14.13。考虑以下实三对角对称n×n矩阵c 10

1 C 1_

…………。

1 C 1_

0 1 C

(1) 利用问题9.6，证明矩阵A的特征值由

(2) 在C上找到一个条件，使A是正定的。满足于c=4？

问题14.14.设a为m×n矩阵，b为n×m矩阵（在c上）。

(1) 证明这一点

det（im−ab）=det（in−ba）。

暗示。考虑矩阵

而且。

(2) 证明这一点

λn det（λim−ab）=λm det（λin−ba）。

暗示。考虑矩阵

而且。

推导出AB和BA具有相同的非零特征值和相同的重数。

问题14.15。这个问题的目的是证明矩阵的特征多项式

是

(1) 证明特征多项式pa（λ）由下式给出

pa（λ）=λn−2p（λ），

具有

-2 1 0

0 0 0 0···0 1−2 1

(2) 证明（二次）多项式p（λ）的根λ1和λ2之和为

λ1+λ2=n2.

因此，问题是计算这些根的积λ1λ2。证明这一点

λ1λ2=p（0）。

(3) 现在的问题是计算dn=p（0），其中

我建议采用以下策略：将第1行和第2行中的第一个条目加上第3行到第1行和第2行的适当倍数，然后将第2行从第1行中减去。

这样做两次。

您会注意到，第一行的前两个条目和第二行的前两个条目会发生变化，但是矩阵的其余部分看起来是相同的，只是维度减小了。

这建议在行列式中建立一个涉及条目UK、VK、XK、YK的复发。

，

···-

从k=0开始，

U0=−1，V0=−1，X0=−2，Y0=−1，

以k=n-2结尾，因此

证明我们有递推关系

这些似乎是讨厌的仿射递推关系，所以我们将使用技巧将这个仿射映射转换为线性映射。

(4) 考虑线性映射

网络错误网络错误网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误网络错误	网络错误网络错误	网络错误 0 网络错误网络错误网络错误 1 网络错误

并表明其对UK、VK、XK、YK的作用与第（3）部分的仿射作用相同。用matlab求矩阵的特征值

	网络错误网络错误网络错误	网络错误网络错误	网络错误	网络错误

2−2 1−1 0_

你会大吃一惊的！

设n为下式给出的矩阵

n=t-i。

证明这一点

N4=0.

用这个来证明

，

所有k≥0。

(5) 证明这一点

，

k≥0时。

证明这一点

，

因此那和那

因此，令人惊奇地证明

(6) 证明A的特征多项式确实是

用上面的例子证明A的两个非零特征值是

负特征值λ1也可以表示为

用这个表达式来解释以下现象：如果我们在a的每个对角项上加上大于或等于（2/25）n2的任何数字，我们得到一个可逆矩阵。0.077351n2怎么样？试试看！

问题14.16。设A为对称三对角N×N矩阵

b1 c1

C1 B2 C2_

C2 B3 C3_

A=……………，

CN−20亿−1 CN−1_

中国-10亿

其中，假设所有i的ci=06，1≤i≤n−1，并假设a k为k×k-子矩阵，由a的前k行和列组成，1≤k≤n。我们将多项式pk（x）定义如下：（0≤k≤n）。

p0（x）=1，

p1（x）=b1−x，

pk（x）=（bk−x）pk−1（x）−c2k−1pk−2（x）、

其中2≤k≤n。

（1）证明下列性质：

(i) pk（x）是ak的特征多项式，其中1≤k≤n。

(ii) limx→−∞pk（x）=+∞，其中1≤k≤n。

(iii) 如果pk（x）=0，则pk−1（x）pk+1（x）<0，其中1≤k≤n−1。

(iv) pk（x）有k个不同的实根，将pk+1（x）的k+1根分开，其中

1≤k≤n−1。

（2）给定任何实数μ>0，对于每k，1≤k≤n，定义函数sgk（μ）如下：

如果pk（μ）=06，则为pk的μ符号（μ）；如果pk（μ）=0，则为pk−1（μ）。

我们将正数的符号编码为+，负数的符号编码为−。

然后让e（k，μ）作为订购列表

e（k，μ）=h+，sg1（μ），sg2（μ），…，sgk（μ）i，

设n（k，μ）为e（k，μ）中连续符号间的符号数变化。

证明sgk（μ）定义良好，n（k，μ）是pk（x）的根数λ，因此λ<μ。

注：上述方法可用于计算（三对角）对称矩阵（Givens Householder方法）的特征值。