第十二章

任意矩阵的二维分解

12.1正交反射

超平面反射由称为户主矩阵的矩阵表示。这些矩阵在数值方法中起着重要作用,例如解线性方程组、解最小二乘问题、计算特征值以及将对称矩阵转换为三对角矩阵。我们证明了一个简单的几何引理,该引理立即产生任意矩阵在户主矩阵方面的二维分解。

正交对称是等轴测的一个非常重要的例子。首先,让我们回顾第5.1节中在5.5提案之后介绍的预测定义。给定一个向量空间e,设f和g为e的子空间,形成一个直接和e=f g。由于每个u∈e都可以唯一地写成u=v+w,其中v∈f和w∈g,我们可以定义两个投影pf:e→f和pg:e→g,这样pf(u)=v和pg(u)=w。在第5.1节中,我们使用t表示π1和π2,但在本节中使用pf和pg更方便。

立即证实pg和pf是线性映射,并且

p2f=pf,p2g=pg,pf pg=pg pf=0,pf+pg=id。

.

定义12.1.给定一个向量空间e,对于任意两个子空间f和g,形成一个直接和e=f_g,关于f和平行于g的对称性(或反射)是线性映射s:e→e,其定义如下:

s(u)=2pf(u)−u,

对于每一个u∈e。

四百零五

因为pf+pg=id,注意我们也有

s(u)=pf(u)−pg(u)

和s(u)=u−2pg(u),

s2=id,s是f上的恒等式,s=-id是g上的恒等式。

我们现在假设e是有限维的欧几里得空间。

定义12.2.设e为有限维n的欧几里得空间。对于任意两个子空间f和g,如果f和g形成一个直和e=f g,f和g是正交的,即f=g,关于f和平行于g的正交对称(或反射)是线性映射s:e→e定义如下:

S(U)=2pf(U)−U=pf(U)−pg(U)、

对于每一个u∈e,当f是一个超平面时,我们称s为关于f的超平面对称(或关于f的反射),当g是一个平面(因此dim(f)=n-2),我们称s为关于f的翻转。

关于超平面f的反射如图12.1所示。

img

图12.1:关于桃超平面f的反射。注意u是紫色,pf(u)是蓝色,pg(u)是红色。

对于任意两个向量u,v∈e,利用内积的双线性很容易验证:

ku+vk2−ku−vk2=4(u·v)。()

特别是,如果u·v=0,那么ku+vk=ku−vk。从那时起

u=pf(u)+pg(u)

12.1。正交反射

和s(u)=pf(u)−pg(u),

因为f和g是正交的,所以它是这样的

pf(u)·pg(v)=0,

因此()

ks(u)k=kpf(u)−pg(u)k=kpf(u)+pg(u)k=kuk,

所以这是一个等值线。

利用命题11.10,可以找到由f的正交基和g的正交基组成的e的正交基(e1,…,e n)。假设f有维数p,使g有维数n−p。关于正交基(e1,…,en),对称s有一个矩阵。形式的

.

因此,det(s)=(-1)n−p,s是一个旋转,如果n−p是偶数。特别地,当f是超平面h时,我们有p=n−1和n−p=1,因此s是不适当的正交变换。当f=0时,我们有s=−id,它被称为相对于原点的对称性。关于原点的对称性是一个旋转,如果n是偶数,如果n是奇数,则不适当的正交变换。当n为奇数时,由于s s=id和det(s)=(-1)n=−1,我们观察到每个不适当的正交变换f都是f s与s的旋转的f=(f s)s的组成,即关于原点的对称性。当g是一个平面时,p=n−2,det(s)=(−1)2=1,因此围绕f的翻转是一个旋转。特别是,当n=3时,f是一条线,绕f线的翻转实际上是测量π的旋转,如图12.2所示。

注:给定任意两个正交子空间f,g,形成一个直和e=f_g,设f为f的对称性,并与g平行,设g为g的对称性,并与f平行。作为练习,我们将

F G=G F=−ID.

当f=h是超平面时,我们可以根据与h正交的任何非零向量w给出s(u)的显式公式。

u=ph(u)+pg(u)、

由于pg(u)∈g和g的范围是w,这与h是正交的,我们得到

pg(u)=λw

img

图12.2:r3中的翻转是π围绕f轴的旋转。

对于一些λ∈r,我们得到

u·w=λkwk2,

因此

img

自从

我们得到

由于上述公式很重要,我们将其记录在下面的命题中。

提案12.1.设e为有限维欧几里得空间,设h为e中的超平面。对于任何与h正交的非零矢量w,关于h的超平面反射s由下式给出:

img

这种反射由称为户主矩阵的矩阵表示,在数值矩阵分析中起着重要作用(见Kincaid和Cheney[100]或Ciarlet[41])。定义12.3.一个户主矩阵如果一个矩阵的形式

其中w∈rn是一个非零向量。

12.1。正交反射

户主矩阵是对称和正交的。可以很容易地检查,在正交基(e1,…,en)上,关于正交于非零矢量w的超平面H的超平面反射由矩阵表示。

其中w是w坐标在基上的列向量(e1,…,en)。自从

img

代表pg的矩阵是

由于ph+pg=id,代表ph的矩阵是

.

这些公式可用于推导出转动r3的公式,给出转动轴的方向w和转动角θ。

下面的事实是证明每个等值线都可以分解为反射的产物的关键。

提案12.2.设e为任意非平凡欧几里得空间。对于任意两个向量u,v∈e,如果kuk=kvk,则存在一个超平面h,使得关于h的反射s映射u到v,如果u=6v,则该反射是唯一的。见图12.3。

证据。如果u=v,那么包含u的任何超平面都会执行该操作。否则,我们必须

H=V−U,根据上述公式,

从那以后

−−

k u k=kvk,k(v−u)k2=2kuk2−2u·v,

因此,s(u)=v。

如果e是一个复向量空间,内积是Hermitian,那么命题12.2是假的。问题是向量v-u不起作用,除非内部积u·v是真实的!这个提议可以被充分地挽救,从而根据户主转换产生QR分解;见第13.5节。

我们现在证明,超平面反射可以用来获得二维分解的另一个证明。

img

图12.3:在r3中,垂直于v-u的(超)平面将u反射到v上。

12.2使用户主矩阵进行QR分解

首先,我们用几何方法描述结果。当根据户主矩阵进行翻译时,我们得到了先前宣传的事实,即每个矩阵(不一定可逆)都有一个QR分解。

提案12.3.设e为维数n的非平凡欧几里得空间。对于任何正交基(e1,…,en)和向量的任何n个元组(v1,…,vn),都有一个n等距序列h1,…,hn,使得hi是超平面反射或恒等式,如果(r1,…,rn)是由rj=hn_给出的向量。···h2_h1(vj)

然后,每个RJ是向量(e1,…,ej)的线性组合,1≤j≤n。等价地,其列是RJ在基(e1,…,en)上的分量的矩阵r是上三角矩阵。此外,还可以选择hi,使r的对角线项为非负。

证据。我们在n上进行归纳,对于n=1,对于一些λ∈r,我们有v1=λe1。如果λ≥0,我们让h1=id,否则如果λ<0,我们让h1=−id,关于原点的反射。对于n≥2,我们首先要找到h1。让

R1.1=kV1K。

如果v1=r1,1e1,我们让h1=id。否则,有一个独特的超平面反射h1,这样

h1(v1)=r1,1 e1,

定义为对于所有u∈e,其中

-

映射h1是关于超平面h1的反射,与向量w1=r1,1 e1−v1正交。见图12.4。出租

img

图12.4:提案12.3中h1的结构。

r1=h1(v1)=r1,1 e1,

很明显,r1属于e1所跨越的子空间,r1,1=kv1k为非负。

接下来假设我们已经找到k线性映射h1,…,hk,超平面反射或恒等式,其中1≤k≤n−1,这样如果(r1,…,rk)是

RJ=香港····H2 H1(VJ)

然后,每个rj是向量(e1,…,ej)的线性组合,1≤j≤k。见图12.5。向量(e1,…,ek)构成UK0表示的子空间的基,向量(ek+1,…,en)构成UK00表示的子空间的基,子空间UK0和UK00是正交的,并且。让

UK+1=hk····h2 h1(vk+1)。

我们可以写信

img

图12.5:提案12.3中r1=h1(v1)的构造。

其中U0K+1∈UK0和。见图12.6。让

.

如果U00K+1=RK+1,K+1EK+1,我们让hk+1=id。否则,有一个独特的超平面反射hk+1,这样定义了所有u∈e,其中

WK+1=RK+1,K+1 EK+1−U00K+1。

地图hk+1是关于超平面hk+1的反射,与向量wk+1=rk+1,k+1 ek+1−u00k+1正交。然而,由于U00K+1、EK+1∈UK00和UK0与UK00正交,子空间UK0包含在hk+1中,因此,属于UK0的向量(R1,…,RK)和U0K+1在hk+1下是不变的。这证明了

HK+1(UK+1)=HK+1(U0K+1)+HK+1(U00K+1)=U0K+1+RK+1,K+1 EK+1

是(e1,…,ek+1)的线性组合。出租

由于UK+1=hk····h2 h1(vk+1),矢量

Rk+1=hk+1····h2 h1(vk+1)

是(e1,…,ek+1)的线性组合。见图12.7。Rk+1对Ek+1的系数为,非负。这就结束了归纳步骤,从而证明了这一点。

img

图12.6:u2=h1(v2)的构造及其分解为。

评论:

(1) 因为每个Hi都是超平面反射或身份,

ρ=hn···h2 h1

是等距测量。

(2) 如果我们在r中允许负对角线项,则可以省略最后一个等值线hn。

(3) 而不是选择Rk,k=ku00kk,这意味着

Wk=Rk,K Ek−U00k,

在1≤k≤n的情况下,如果这使kwkk2变大,则最好选择该值,在这种情况下

.

事实上,由于香港的定义涉及KWKK2除法,所以最好避免用非常小的数字除法。

(4) 该方法也适用于任意m-向量元组(v1,…,vm),m≤n,则r为上三角m×m矩阵,q为带正交列的n×m矩阵(q>q=im)。我们把对方法的微小调整留给读者作为练习。

命题12.3根据户主转换直接产生QR分解(见Strang[164,165]、Golub和van Loan[80]、Trefethen和Bau[171]、Kincaid和Cheney[100]或Ciarlet[41])。

img

img

图12.7:提案12.3中h2和r2=h2 h1(v2)的构造。

定理12.4.对于每个实n×n矩阵a,有一个矩阵的序列h1,…,hn,其中每个hi要么是一个户主矩阵,要么是一个恒等式,以及一个上三角矩阵。

R是这样的

R=hn···h2h1a。

作为推论,有一对矩阵q,r,其中q是正交的,r是上三角的,这样a=qr(a的qr分解)。此外,可以选择r,使其对角线项为非负。

证据。a的jth列可以看作是en的规范基(e1,…,en)上的矢量vj(其中(ej)i=1,如果i=j,则为0,否则为1≤i,j≤n)。将命题12.3应用于(v1,…,vn),有一个n等轴测h1,…,hn的序列,使得hi是超平面反射或恒等式,如果(r1,…,rn)是

rj=hn····h2 h1(vj)

那么每个r j都是向量(e1,…,ej)的线性组合,1≤j≤n。假设r是向量rj的列的矩阵,hi是与hi相关的矩阵,很明显

R=hn···h2h1a,

其中r是上三角形,每个hi都是户主矩阵或恒等式。但是,hi hi=所有i的id,1≤i≤n,依此类推。

Vj=h1 h2···hn(RJ)

对于所有j,1≤j≤n。但ρ=h1 h2····hn是由正交矩阵q=h1h2·····hn表示的等值线。很明显,a=qr,其中r是上三角形。正如我们在命题12.3中所指出的,r的对角线项可以选择为非负。

评论:

(1)出租

AK+1=hk···h2h1a,

当a1=a,1≤k≤n时,命题12.3的证明可以用矩阵a1,…,an+1=r的序列的计算来解释。矩阵ak+1

网络错误
网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

其中,矩阵的第(k+1)列是向量

英国+1=hk···h2 h1(vk+1)

因此

img

.

如果k+1列中的最后一个n−k−1项都为零,则无需执行任何操作,我们让hk+1=i。否则,我们将这些n−k−1项乘以左边的ak+1,再乘以户主矩阵hk+1发送

至(0,…,0,Rk+1,K+1,0,…,0)

哪里。

(2) 如果a是可逆的,r的对角线项是正的,则可以表明q和r是唯一的。

(3) 如果我们在r中允许负对角项,矩阵hn可以省略(hn=i)。

(4) 这个方法可以计算a的行列式。

Det(a)=(-1)mr1,1····rn,n,

其中,m是hi中的户主矩阵(而不是同一性)的数目。

(5) 矩阵A的“条件号”被保留(见Strang[165]、Golub和van Loan[80]、Trefethen和Bau[171]、Kincaid和Cheney[100]或Ciarlet[41])。这对数值稳定性非常有利。

(6) 该方法也适用于矩形M×N矩阵。如果m≥n,则r为n×n上三角矩阵,q为m×n矩阵,q>q=in。

下面的matlab函数使用户主反射实现了实平方(可能是奇异的)矩阵a的qr因子分解方法。

主函数houseqr计算通过对a应用householder反射得到的上三角矩阵r,它利用函数house计算单位向量u,从而给出向量x∈r p,householder转换p=i−2uu>将x中除th以外的所有项置零。e第一个条目x1。仅当kx(2:p)k1=x2+··········xp>0时适用。由于计算是在浮点进行的,所以我们使用一个公差因子tol,如果kx(2:p)k1≤tol,那么我们返回u=0,这表明相应的户主转换是同一性。为了确保kpxk尽可能大,我们选择uu=x+符号(x1)kxk2 e1,其中,如果z≥0,符号(z)=1,如果z<0,符号(z)=1。请注意,因此,R中的对角线条目可能是负数。我们稍后会处理这个问题。

函数s=signe(x)

%如果x大于等于0,则signe(x)=1

%否则,如果x<0,则signe(x)=-1

%

如果x<0

S=-1;

其他的

S=1;

端部功能[u u,u]=房屋(x)

%这构造了一个非规范化的向量uu%,它定义了户主反射,该反射除了x中的第一个条目外,其余的都为零。

%u是归一化向量uu/uu||

%

tol=2*10^(-15);%公差uu=x;p=尺寸(x,1);

%计算x的l^1-范数(2:p,1)n1=和(abs(x(2:p,1));如果n1<=tol

u=零(p,1);uu=u;

其他的

l=sqrt(x’x);%l^2 x u u(1)=x(1)+signe(x(1))l;u=uu/sqrt(uu’*uu);结束

户主转换记录在n-1向量的数组u中。有更有效的实现,但是为了清晰起见,我们提供了以下版本。

函数[r,u]=houseqr(a)

%此函数计算qr因子分解中的上三角r

%一个使用户主的思考,和一个隐含的代表

%作为代表户主的n-1向量的序列

%反射

n=尺寸(a,1);r=a;

u=零(n,n-1);对于i=1:n-1

[~,u(i:n,i)]=房屋(r(i:n,i));如果u(i:n,i)==零(n-i+1,1)

r(i+1:n,i)=0(n-i,1);否则

r(i:n,i:n)=r(i:n,i:n)-2u(i:n,i)(u(i:n,i)’*r(i:n,i:n));末端

如果只需要R,那么houseqr就可以完成这项工作。为了获得R,我们需要组成户主转换。我们提出了一种不是最有效的简单方法(有一种方法可以避免户主矩阵的明确乘法)。

buildhouse函数从向量v创建一个户主反射。

功能P=建筑房屋(V,I)

%这个功能建立了一个户主的反映

%[I 0]%[0页]

%从户主的反映

%pp=i-2uu*uu’

%式中uu=v(i:n)

%如果uu=0,则p-i

%

n=尺寸(v,1);如果v(i:n)=0(n-i+1,1)

P=眼睛(N);其他

pp=眼睛(n-i+1)-2v(i:n)v(i:n)’;

P=[眼(i-1)零(i-1,n-i+1);零(n-i+1,i-1)p p];结束

函数buildq在a的qr分解中构建矩阵q。

函数q=构建q(u)

%在QR分解中建立矩阵Q

%使用户主矩阵的nxn矩阵a,

%其中u代表n-1

%户主反射由产生的向量列表u

%房屋

n=尺寸(u,1);

Q=建筑物(U(:,1),1);对于i=2:n-1

Q=Q*Buildhouse(U(:,I),I);结束

函数buildhouseqr计算a的qr因子分解。最后,如果r对角线上的某些项为负数,它将创建一个对角线正交矩阵p,使pr具有非负对角线项,因此a=(qp)(pr)是a的所需qr因子分解。

功能[q,r]=建筑屋qr(a)

%

%计算正方形的qr分解

%使用户主反射的矩阵A(可能是单数)

n=尺寸(a,1);

[r,u]=房屋qr(a);

Q=建筑Q(U);

%生成一个矩阵r,其对角线项为

%非负p=眼(n);对于i=1:n,如果r(i,i)<0

p(i,i)=-1;结束

结束

Q=QP;R=PR;

结束

例12.1。考虑矩阵

.

运行函数buildhouseqr,我们得到

img 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 img
img 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

观察A的等级为2。读者应检查a=qr。

备注:奇怪的是,运行matlab内置函数q r,得到相同的r(最多列符号),但得到不同的q(最后两列不同)。

12.3总结

本章的主要概念和结果如下:

• 关于f和平行于g的对称(或反射)。

• 关于f和g的正交对称(或反射);反射,翻转。

• 超平面反射和户主矩阵。

• 关于反思的关键事实(提案12.2)。

• 根据户主变换的qr分解(定理12.4)。

12.4问题

问题12.1。(1)给定单位向量(−sinθ,cosθ),证明由向量(−sinθ,cosθ)确定的户主矩阵是

.

给出几何解释(即为什么选择(−sinθ,cosθ)?(2)给出任何矩阵

证明有一个户主矩阵h,使得ah是下三角形,即,

img

对于一些a0,c0,d0∈r。

问题12.2。给出了一个维数为n的欧几里得空间e,如果h是一个与非零向量u正交的超平面的反射,而f是任何一个等距,证明f h f−1是一个与f(u)正交的超平面的反射。

问题12.3。(1)给出矩阵

证明有户主矩阵g,h,这样

img

其中d是一个对角矩阵,如果下列方程成立:

(b+c)cos(θ+_)=(a-d)sin(θ+),(c-b)cos(θ-)=(a+d)sin(θ-)。

(2)讨论系统的可解性。考虑以下情况:

情况1:A−D=A+D=0。

案例2a:a−d=b+c=0,a+d=0.6

案例2b:a−d=0,b+c=06,a+d=0.6案例3a:a+d=c−b=0,a−d=0.6

案例3b:A+D=0,C−B=06,A−D=0.6

案例4:A+D=06,A-D=06。显示这种情况下的解决方案是

如果b=0,说明讨论更简单:基本上,考虑c=0或c=0.6

(3)用u=cotθ和v=cot_表示,表明(2)中的方程

(b +c)(u v−1)=(u+v)(a−d),

(c −b)(u v+1)=(−u+v)(a+d)。

问题12.4.设a为n×n实可逆矩阵。

(1)证明a>a是对称正定的。

(2)使用Cholesky因式分解a>a=r>r和r上三角带正对角项证明q=ar−1是正交的,因此a=qr是a的qr因式分解。

问题12.5。修改函数houseqr,使其适用于m≥n的m×n矩阵,以生成m×n上三角矩阵,其最后的m-n行为零。

问题12.6.这个问题的目的是证明,给定任意自伴线性映射f:e→e(即f=f),其中e是尺寸n≥3的欧几里得空间,给定一个正交基(e1,…,en),存在n-2等距线hi、超平面反射或恒等式,使得的trix

hn−2···h1 f h1··hn−2

是对称三对角矩阵。

(1)证明对于任何等距线f:e→e,我们有f=f=f−1 iff f=id。

证明如果f和h是自伴线性映射(f=f和h=h),则h f h是自伴线性映射。

(2)设vk为(ek+1,…,en)所跨越的子空间。通过归纳法进行。对于基本情况,按以下步骤进行。

.

找到一个h1(反射或id)等距线,这样

h1(f(e1)−a01e1)=r1,2 e2。

观察w1=r1,2e2+a01e1−f(e1)∈v1,

并证明h1(e1)=e1,因此

.

设f1=h1 f h1。

通过归纳假设

fk=香港···h1 f h1···香港

具有一个到第k行和第k列的三对角矩阵,1≤k≤n-3,让

找到一个等距线hk+1(反射或ID),以便

HK+1(FK(EK+1)−AKKEK−AKK+1EK+1)=RK+1,K+2 EK+2。

注意

并证明hk+1(ek)=ek和hk+1(ek+1)=ek+1,因此

hk+1 fk hk+1(ek+1)=akkek+akk+1ek+1+rk+1,k+2 ek+2。

让fk+1=hk+1 fk hk+1,完成证明。

(3) 证明在任意对称n×n-矩阵a下,存在n-2矩阵h1,…,hn-2,

户主矩阵或身份,这样

B =hn−2···h1ah1···hn−2

是对称三对角矩阵。

(4) 编写实现上述方法的计算机程序。

问题12.7.从问题中回忆?如果所有(j,k)的hjk=0,则n×n矩阵h为上Hessenberg,因此j−k≥0。调整问题12.6的证明,以证明在给定任何n×n矩阵a的情况下,存在n−2≥1矩阵h1,…,hn−2,户主矩阵或身份,从而

B =hn−2···h1ah1···hn−2

是上海森堡。

问题12.8。这个问题的目的是证明,给定线性映射f:e→e,其中e是尺寸n≥2的欧几里得空间,给定正交基(e1,…,en),存在等距gi、hi、超平面反射或恒等式,使得

gn···g1 f h1···hn

是一个较低的双对角矩阵,这意味着非零项(如果有的话)位于主降对角线和其下的对角线上。

是(e1,…,ek)所跨越的子空间,是(ek+1,…,en),1≤k≤n-1所跨越的子空间。对基本情况进行归纳,如下进行。设v1=f(e1)和r1,1=kv1k。求一个h1(反射或ID)等距线,使

h1(f(e1))=r1,1e1。

注意,这样

hh1(f(e1)),eji=0

对于所有j,2≤j≤n,并得出结论:

he1,f_h1(ej)i=0

对于所有j,2≤j≤n。

下一个let

在哪里,让。找一个等距线g1(反射或ID),这样

.

显示g1(e1)=e1,

而he1,g1 f h1(ej)i=0

对于所有j,2≤j≤n。在本阶段结束时,表明g1 f h1具有一个矩阵,使得其第一行上的所有条目(可能第一行除外)都为零,并且第一列上的所有条目(可能前两列除外)都为零。

通过归纳,假设已经发现了一些等轴测图g1,…,gk和h1,…,hk,或者反射,或者身份,并且

fk=gk····g1 f h1···hk

具有一个矩阵,该矩阵在K行和K列之前(包括K列),其中1≤K≤N-2。

在哪里,让。找到一个等距线hk+1(反射或ID),以便

.

显示如果hk+1是反射,则UK0 hk+1,其中hk+1是定义反射hk+1的超平面。推断hk+1(vk0+1)=vk0+1,并且

hk+1(fk(ek+1))=vk0+1+rk+1,k+1ek+1。

注意,这样

img

对于所有j,k+2≤j≤n,因此,

hek+1,fk_hk+1(ej)i=0

对于所有j,k+2≤j≤n。

下一个let

其中U0K+1∈UK0+1和,并设为。找一个等距线GK+1

(反射或ID)使得

.

如果gk+1是反射,那么,其中gk+1是定义反射gk+1的超平面。推断所有i的gk+1(ei)=ei,1≤i≤k+1,以及

.

因为通过归纳假设,

hei,fk_hk+1(ej)i=0

对于所有i,j,1≤i≤k+1,k+2≤j≤n,由于gk+1(ei)=ei对于所有i,1≤i≤k+1,得出如下结论:

hei,gk+1_fk_hk+1(ej)i=0

对于所有i,j,1≤i≤k+1,k+2≤j≤n,完成证明。