第四十二章

舒尔补充与应用

42.1舒尔补充

舒尔补数在形式的块矩阵求逆过程中自然产生。

img

在描述这些矩阵的对称形式是正定或半正定的时候。这些特征出现在各种二次优化问题中;见Boyd和Vandenberghe[29],特别是附录B。在最一般的情况下,还需要伪逆。

在这一章中,我们介绍了舒尔的补充语,并描述了几种有趣的使用方法。在此过程中,我们提供了博伊德和范登堡[29]附录A.5(特别是第A.5.5节)中某些结果的一些细节和证明。设m为n×n矩阵,写为2×2块矩阵

其中a是p×p矩阵)。我们可以尝试求解线性系统p矩阵,d是q×q矩阵,n=p+q(b是p×q矩阵)

而c是q×。

也就是说,

网络错误 网络错误 网络错误
网络错误 网络错误 网络错误

一千四百零三

通过模拟高斯消去。如果我们假设d是可逆的,那么我们首先求解y,得到

y=d−1(d−cx)

在第一个方程中用这个表达式代替y之后,我们得到

ax+b(d−1(d−cx))=c,

也就是说,

(a−bd−1c)x=c−bd−1d。

如果矩阵A−bd−1c是可逆的,那么我们就得到了系统的解。

.

如果a是可逆的,那么首先使用第一个方程消除x,我们得到涉及矩阵d−ca−1b的类似公式。上述公式表明矩阵a−bd−1c和d−ca−1b起到特殊作用,并建议以下定义:定义42.1。给定任意n×n形式的分块矩阵

其中a是p×p矩阵,d是q×q矩阵,n=p+q(所以b是p×q矩阵,c是q×p矩阵),如果d是可逆的,那么矩阵a−bd−1c在m中称为d的schur补码。如果a是可逆的,那么矩阵d−ca−1b称为i的schur补码。N.

上述方程写为

X=(A−bd−1c)−1c−(A−bd−1c)−1bd−1d,Y=−d−1c(A−bd−1c)−1c

+(D−1+D−1C(A−BD−1C)−1BD−1)D,

根据m中d的舒尔补码,得出m的倒数公式,即

.

一瞬间的思考就可以发现

然后

.

通过求逆,我们得到如下结果。

42.1。舒尔补充1405

提案42.1.如果矩阵d是反转的,那么

.

上述表达式可以直接检验,且只要求d的可逆性。

备注:如果a是可逆的,那么我们可以使用a的schur补码d−ca−1b来获得m的下列因式分解:

.

如果d−ca−1b是可逆的,我们可以把上面的三个矩阵都颠倒过来,得到m的逆矩阵的另一个公式(d−ca−1b),即:

.

如果a、d和schur的两个补a−bd−1c和d−ca−1b都是可逆的,通过比较m−1的两个表达式,我们得到(不明显的)公式。

(A−BD−1C)−1=A−1+A−1B(D−CA−1B)−1CA−1。

利用这个公式,我们得到了涉及a和d的舒尔补的m的逆表达式(见Horn和Johnson[92]):

提案42.2.如果a、d和两个schur互补a−bd−1c和d−ca−1b都是可逆的,那么

.

如果我们设置d=i,将b改为−b,我们得到

(A+BC)−1=A−1−A−1b(I−CA−1b)−1ca−1,

一个称为矩阵反演引理的公式(见Boyd和Vandenberghe[29],附录C.4,特别是C.4.3)。

42.2对称正定矩阵和舒尔补

如果假设我们的块矩阵m是对称的,因此a,d是对称的,c=b>那么我们看到m表示为

这表明m类似于块对角矩阵(很明显,schur补码a−bd−1b>是对称的)。因此,我们有以下版本的“schur’s trick”来检查对称矩阵是否为0。

提案42.3.对于任意对称矩阵m的形式

如果c是可逆的,则以下属性保持不变:

.

,然后。

证据。(1)注意

我们知道,对于任何对称矩阵t和任何可逆矩阵n,矩阵t是正定的(显然是对称的)是正定的。

0)。但是块对角矩阵是正定的,如果每个对角块是

正定,即证明的结论。

(2)这是因为对于任何对称矩阵t和任何可逆矩阵n,我们有

tnt>

第42.3号提案的另一个版本也适用,使用a的schur补语代替c的schur补语。证明使用m的因式分解,使用a的schur补码(见第42.1节)。

提案42.4.对于任意对称矩阵m的形式

如果a是可逆的,则以下属性保持不变:

42.3。半定矩阵与舒尔补1407

.

,然后。

这是42.4(2)号提案的一个例子。考虑非线性二次约束

(ax+b)>(ax+b)≤c>x+d,

是a∈mn(r),x,b,c∈rn和d∈r,由于显然i=in是可逆的,所以我们

img

如果c>x,因为矩阵(标量)c>x+d−(ax+b)>(ax+b)是上述矩阵中i的舒尔补码。

利用Schur互补将非线性不等式约束转化为包含半定义序的对称矩阵的线性约束的技巧被广泛地用于将非线性问题转化为半定程序;见Boyd和Vandenberghe。

〔29〕。

当c是奇异的(或a是奇异的)时,当上面的对称矩阵m是半正定的时,仍然可以描述它,但这需要使用包含c的伪逆的schur补码版本,即a−bc+b>(或a的schur补码,c−b>a+b)。我们使用命题41.5的标准,它告诉我们形式的二次函数何时有最小值,以及这个最佳值是什么(其中p是对称矩阵)。

42.3对称半正定矩阵和舒尔补

现在我们回到原来的问题,描述一个对称矩阵

img

是正半定的。因此,我们想知道函数

img

对于x和y都有一个最小值。如果我们保持y常数,则命题41.5意味着f(x,y)的最小iff为0且(i−a a+)为0,则最小值为

f(x,y)=−y>b>a+by+y>cy=y>(c−b>a+b)y。

因为我们希望f(x,y)在所有x,y下都是一致的有界的,所以我们必须有(i−

aa+)b=0.现在,f(x,y)的最小iff为0。因此,我们确定f(x,y)在所有x,y iff上都有一个最小值。

.

如果我们首先对y最小化,然后对x最小化,那么也适用类似的推理,但这一次涉及到c的schur补码a−bc+b>。把这些事实综合起来,我们得到了主要的结果:

定理42.5。给定任意对称矩阵

img

以下条件等效:

是正半定的)。

.

如果0如定理42.5所示,那么很容易检查我们是否有以下的因式分解(使用a+aa+=a+和c+cc+=c+的事实):