继续讨论对称矩阵。对称双线性形能够给出对称矩阵(Gram矩阵),而定义在线性空间上的二次型,即满足
的函数
也能给出实对称矩阵(例如,看这里)。事实上,只要线性空间的基域的特征不等于2,那么实对称矩阵,对称双线性形,实线性空间上的二次型这三个范畴是互相等价的。
已知实对称矩阵一定可以对角化,通常教科书会给出两种方法,其一是配方法。使用配方法,要区分两种情况,即实对称矩阵第(1, 1) 位置是否为0. 如果该位置的元素非0,意味着相应的二次型有这一项,此时可以先配出
%5E2#card=math&code=%28x1%2B%5Csum%7Bi%5Cgeq%202%7D%20c_i%20x_i%29%5E2&id=Nh9m4)的形状;如果第(1, 1)位置的元素为0,意味着相应的二次型没有
这一项。此时假设实对称矩阵第1行第一个非零元在第
列,则先作变量代换
, 则原二次型中
这一项变成
. 就化归为实对称矩阵第(1, 1)位置非0的情况。
证明实对称矩阵一定可以对角化的另一个常用方法是找出由单位特征向量组成的正交矩阵,将原对称矩阵相似对角化。由于实对称矩阵属于不同特征值的特征向量互相正交,所以,如果如果实对称矩阵所有特征值的代数重数都是1(即特征多项式所有的根互不相同),那直接求出相应的单位特征向量,把这些单位特征向量摆成一个矩阵即可。
如果实对称矩阵有特征值的代数重数大于1,此时求出相应的特征向量后,使用Schmidt正交化,就可以得到互相正交的向量,来摆成正交矩阵。
注:还可以用数学归纳法来证明实对称矩阵一定合同于对角矩阵
,即
但无法保证矩阵
是正交矩阵。
下面谈谈为何实对称矩阵一定可以对角化。我们从几个角度来讨论。
(i) 存在复对称矩阵,不可以对角化。例如.
这是因为:对于复向量, 从
无法保证
. 但如果
是对
所有分量都取复共轭,那么从
,就必定可得
. 所以”实对称”矩阵,推广到复矩阵时,只要求复对称是不够的,应该要求
. (共轭转置)。
我们把满足条件的复方阵
称为Hermitian矩阵。(Charles Hermite, 1822-1901, 法国数学家)。通常写
等记号表示
.
我们继续考虑实对称矩阵。下面看
(ii) 为何不是对称的(实)矩阵,可能无法对角化。
我们以矩阵为例。它的特征值是
(二重),特征子空间是线性方程组
的解空间,即span. 由于矩阵
是2阶的,但特征子空间只有1维,所以找不到足够多的特征向量,来把
对角化。与矩阵
对比,可知
在对角线的”肩膀”上那个1,导
不能对角化。
也可以说,因为不是对称的。因为
同样不能对角化,但矩阵
却可以对角化。
(iii) 实对称矩阵能对角化,也可以用下面的定理解释:
定理:设是
维实欧几里得空间,
是
阶实对称矩阵,它在
上定义了线性变换
. 如果
是
的不变子空间,那么它的正交补
也是
的不变子空间。
用这个定理,容易推出的单位特征向量(必要时通过Schmidt正交化)构成
的一个标准正交基,所以
可以对角化。
(iv) 典型的实对称矩阵有以下两类:正交投影矩阵(即满足的实矩阵);形如
的矩阵,其中
是任意实矩阵。正交投影矩阵之前已经介绍过,下回我们讨论第二类。
最后看一个例子:取#card=math&code=V%3D%5Cmathrm%7BM%7D_2%28%5Cmathbb%7BR%7D%29&id=f4HzZ), 内积定义为
%3A%3D%20%5Cmathrm%7Btr%7D(A%20B%5E%5Ctop).%0A#card=math&code=%28A%2C%20B%29%3A%3D%20%5Cmathrm%7Btr%7D%28A%20B%5E%5Ctop%29.%0A&id=Pm9wE)
矩阵
关于上面的内积,是标准正交基。
(i) 定义线性变换. 则在上面标准正交基之下,
的矩阵是
这是实对称矩阵。的确,利用等式, 很容易验证
%20%3D%20(A%2C%20%5Cmathcal%7BT%7D%20B).%0A#card=math&code=%28%5Cmathcal%7BT%7D%20A%2C%20B%29%20%3D%20%28A%2C%20%5Cmathcal%7BT%7D%20B%29.%0A&id=xDx7Q)
线性变换的不变子空间是
0维:
1维:
2维:
3维:
4维:
易见任意一个不变子空间的正交补,也是不变子空间。
(ii) 取子空间%20%5Csubset%20V#card=math&code=W%20%3D%20%5Cmathrm%7Bspan%7D%28e_1%2C%20e_2%2C%20e_3%2Be_4%29%20%5Csubset%20V&id=F7Boe). 则
#card=math&code=W%5E%5Cperp%20%3D%20%5Cmathrm%7Bspan%7D%28e_3%20-%20e_4%29&id=FwLjo). 定义
是从
到
的正交投影。则
在标准正交基
#card=math&code=%28e_1%2C%20e_2%2C%20e_3%2C%20e_4%29&id=KNl7D)之下的矩阵是
设#card=math&code=S%20%3D%5Cfrac%7B1%7D%7B2%7D%5Cbegin%7Bpmatrix%7D%201%20%26%201%20%5C%5C%201%26%201%5Cend%7Bpmatrix%7D%2C%20%5C%3B%20M%20%3D%20%5Cfrac%7B1%7D%7B%5Csqrt%7B2%7D%7D%281%2C%201%29&id=b7KsE). 由于
, 故
%20M%3D%20M%5E%5Ctop%20M%3DS#card=math&code=S%5E2%20%3D%20M%5E%5Ctop%20%28M%20M%5E%5Ctop%29%20M%3D%20M%5E%5Ctop%20M%3DS&id=t0eun). 由此不难看出
.
(2022年5月14日更新)最后看如何使对角化. 我们想找正交矩阵
使得
是对角矩阵。求得
的特征值是0, 1. 相应的特征向量是
取
即可。
设是所有元素都等于1的
阶方阵。如果想把
对角化,因为0是
的n-1 重特征值,(另一个特征值是
,所以如果想要找正交矩阵把
对角化,则需要把属于特征值0的特征向量,作Schmidt正交化(再单位化),而属于特征值
的特征向量,则需要取单位长度的特征向量。