第六章

行列式

6.1排列,排列的签名

本章回顾了行列式及其在线性代数中的应用。我们从排列和排列的签名开始。接下来,我们定义多行映射和交替多行映射。行列式作为交替的多行映射引入,在单位矩阵上取1(遵循Emil Artin)。然后给出了用拉普拉斯展开式计算行列式的方法,并给出了与一般定义的联系。它展示了如何使用行列式来反转矩阵和求解(至少在理论上!)线性方程组(克莱默公式)。定义了线性映射的行列式。我们通过定义矩阵的特征多项式(和线性映射的特征多项式)和证明著名的凯莱-汉密尔顿定理得出结论,该定理指出每个矩阵都是其特征多项式的“零”(我们给出两个证明;一个是计算性的,另一个是概念性的)。

行列式可以用几种方式定义。例如,行列式可以通过向量空间的外部代数(或交替代数)以奇特的方式定义。由于Emil Artin的原因,我们将采用更为算法化的方法。无论采用哪种方法,我们都需要对有限集上的置换进行一些初步的研究。我们需要证明n个元素上的每一个置换都是置换的产物,并且所涉及的置换数目的奇偶性是置换的不变量。设[n]=1,2…,n,其中n∈n,n>0。

定义6.1.n元素的排列是双射π[n]→[n]。当n=1时,从[1]到[1]的唯一函数是常量映射:17→1。因此,我们假设n≥2。一个换位是一个置换τ[n]→[n],这样,对于一些i<j(1≤i<j≤n),τ(i)=j,τ(j)=i,和τ(k)=k,对于所有k∈[n]−i,j。换言之,换位交换两个不同的元素i,j∈[n]。k阶的循环置换(或k-循环)是一个置换σ:【n】→【n】,因此,对于某些序列(I1、I2,…,Ik),不同元素的

[n]2≤k≤n时,

σ(i1)=i2,σ(i2)=i3,…,σ(ik−1)=ik,σ(ik)=i1,

一百三十五

且σ(j)=j,对于j∈[n]−i1,…,ik。集合I1,…,Ik称为循环置换的域,循环置换通常用(I1 I2…IK)。

如果τ是一个换位,显然,ττ=id。另外,2阶的循环置换是一个换位,对于k阶的循环置换σ,我们有σk=id。很明显,两个置换的组合是一个置换,每个置换都有一个逆,也是一个置换。因此,[n]上的排列集是一个通常表示sn的群。通过归纳,很容易看出sn组有n个!元素。我们还将使用排列(或换位)的术语产物作为排列组合的同义词。

n个元素上的置换σ,如σ(i)=ki(i=1,…,n),可用2×n数组的函数表示法表示。

img

被称为柯西双线符号。例如,我们的置换σ表示为

.

在计算机科学和组合数学中经常使用的一种更简洁的表示法是用图像来表示排列,即用序列来表示排列。

σ(1)σ(2)···σ(n)

作为行向量写入,不使用逗号分隔条目。以上就是所谓的单线符号。例如,在一行符号中,我们前面的置换σ表示为

2 4 3 6 5 1.

不将上述序列括在括号内的原因是避免与循环符号混淆,通常情况下,循环符号包括括号。

下面的命题说明了循环置换和换位的重要性。

提案6.1.对于每一个n≥2,对于每一个置换π[n]→[n],有一个将[n]划分为r子集的区域,称为π的轨道,其中1≤r≤n,其中该区域中的每一个集合j要么是一个单子i,要么是形式。

j=i,π(i),π2(i),…,πri−1(i),

其中ri是最小的整数,比如πri(i)=i和2≤ri≤n。如果π不是同一性,那么它可以用一种独特的方式(按顺序)写成π=σ1…具有不相交域的循环置换的σs,其中s是具有至少两个元素的轨道数。每一个排列π:【n】→【n】都可以写成一个非空的换位组合。

6.1。排列,排列的签名

证据。考虑在[n]上定义的关系rπ,如下所示:irπj iff有一些k≥1,因此j=πk(i)。我们声称Rπ是一个等价关系。传递性是明显的。我们声称,对于每一个i∈[n],都有一些最小r(1≤r≤n),这样πr(i)=i。

实际上,考虑以下n+1元素的序列:

嗨,π(i),π2(i),…,πn(i)i。

因为[n]只有n个不同的元素,所以存在一些h,k,其中0≤h<k≤n,这样

πh(i)=πk(i)、

由于π是双射,这意味着πk−h(i)=i,其中0≤k−h≤n。因此,我们证明了存在一些整数m≥1,这样πm(i)=i,所以存在这样一个最小的整数r。

因此,Rπ是自反的。它是对称的,因为如果j=πk(i),让r最小r≥1,这样πr(i)=i,那么

i=πkr(i)=πk(r−1)(πk(i))=πk(r−1)(j)。现在,对于每一个i∈[n],i的等价类(轨道)是[n]的子集,或者是单子

i或一套表格

j=i,π(i),π2(i),…,πri−1(i),

式中,ri是最小整数,使得πri(i)=i和2≤ri≤n,在第二种情况下,π对j的限制导致循环置换σi和π=σ1…σs,其中s是具有至少两个元素的等价类数。

对于命题的第二部分,我们从n开始归纳,如果n=2,在[2]上正好有两个置换,置换τ交换1和2,以及同一性。然而,id2=τ2。现在,设n≥3。如果π(n)=n,因为根据诱导假设,π对[n−1]的限制可以写成转置的乘积,π本身可以写成转置的乘积。如果π(n)=k=6n,假设τ为τ(n)=k和τ(k)=n的转置,很明显,τπ保持n不变,根据诱导假设,我们得到τπ=τm……τ1表示某些转置,因此

π=ττm…τ1,

换位的产物(因为ττ=idn)。

注:当π=idn为同一置换时,我们可以认为0置换的组合是同一置换。命题6.1的第二部分表明,换位产生一组置换sn。

在写置换π作为组成π=σ1…循环置换的σs,很明显,σi的顺序并不重要,因为它们的域是不相交的。给出了一个作为转置的乘积而写的排列,我们现在证明了转置数的奇偶性是一个不变量。

定义6.2.对于每个n≥2,因为每个置换π[n]→[n]定义了R子集的一个分区,在该分区上π要么作为恒等式,要么作为循环置换,let),称为π的签名,由定义,其中r是分区中的集合数。

如果τ是交换i和j的换位,那么很明显,与τ相关的分区由n-1等价类、集合i、j和n-2单子集k组成,对于k∈[n]−i、j,因此,

提案6.2.对于每一个n≥2,对于每一个置换π,我们有:

.

因此,对于每一个转置的乘积,例如π=τm…τ1,我们有

这表明转置数的奇偶性是一个不变量。

证据。假设τ(i)=j和τ(j)=i,其中i<j。有两种情况,取决于i和j是在Rπ的相同等效类jl中,还是在不同的等效类中。如果我和J属于同一类,那么如果

jl=i1,…,ip,…iq,…ik,

其中ip=i和iq=j,因为

τ(π(π−1(ip)))=τ(ip)=τ(i)=j=iq

τ(π(iq−1))=τ(iq)=τ(j)=i=ip,

很明显,jl分为两个子集,其中一个子集是,因此,与τπ相关的类的数量是r+1,而j在不同的等价类jl和jm中,例如

I1,…,IP,…,IH

j1,…,jq,…jk,

其中ip=i,jq=j,因为

τ(π(π−1(ip)))=τ(ip)=τ(i)=j=jq

τ(π(π−1(jq)))=τ(jq)=τ(j)=i=ip,

6.2。交替多行地图

我们看到类jl和jm合并为一个类,因此,与τπ相关的类的数量是r−1,并且

现在,让π=τm…τ1是转位的任何产物。在命题的第一部分,我们有

从1开始换位。

注:当π=idn为单位置换时,由于我们一致认为0个置换的组合是单位置换,所以((id)=+1仍然正确。从这个提议来看,这是直接的。特别是,由于π−1π=idn,我们得到

我们现在可以继续讨论行列式的定义。

6.2交替多行地图

首先,我们定义多行映射、对称多行映射和交替多行映射。

注:本节给出的大多数定义和结果也适用于K是交换环时,以及当我们考虑K上的模时(自由模,当需要基时)。

设e1,…,en,和f为k域上的向量空间,其中n≥1。

定义6.3.函数f:e1×…×en→f是多行映射(或n-线性映射),如果每个参数是线性的,则保持其他参数不变。更明确地说,对于每一个I,1个i i,n,对于所有的X1……E1,XI,1,1,1,1,……,对于所有x,y,Ei,所有的,

f(x1,…,Xi,1,x+y,Xi+ 1,…,xn)=f(x1,…,Xi,1,x,Xi+1,…,xn)

+f(x1,…,Xi,1,y,Xi+ 1,…,Xn),

f(x1,…,Xi,1,Lax x,Xi+ 1,…,Xn)=αf(x1,…,Xi,1,x,Xi+1,…,Xn)。

当f=k时,我们称之为n-线性形式(或多行形式)。如果n≥2且e1=e2=…=e n,n-线性映射f:e×…×e→f称为对称,如果f(x1,…,x n)=f(xπ(1),…,xπ(n)),对于1,…,n上的每个置换π。n-线性映射f:e×…×e -εf被称为交错,如果f(x1,…,xn)=0,每当Xi=Xi+1时,对于某些i,1的i=n=1(换言之,当两个相邻的参数相等)。当n=1时,线性映射被认为是对称的和交替的,我们这样做并不有害。

当n=2时,2线性映射f:e1×e2→f称为双线性映射。我们已经看到了几个双线性图的例子。乘法·:k×k→k是一个双线性映射,把k作为一个向量空间。一般来说,A环中的乘法·:A×A→A是双线性映射,将A视为一个模块。

将线性形式应用于向量的操作h−、−i:e×e→k是双线性映射。

对称双线性映射(和多线性映射)在几何(内积、二次型)和微分学(偏导数)中起着重要作用。

双线性映射是对称的,如果f(u,v)=f(v,u),对于所有u,v∈e。

交替多行映射满足以下简单但关键的特性。

提案6.3.设f:e×…×e→f为n线性交替图,n≥2。以下属性保留:

(1)f(…,Xi,Xi+1,…)=f(…,Xi+1,Xi,…)

(2)

F(…,Xi,…,XJ,…)=0,

其中Xi=Xj,1<i<J<n。

(3)f(…,Xi,…,XJ,…)=f(…,XJ,…,XI,…);

其中1≤i<j≤n。

(4)

F(…,Xi,…)=f(…,X+S* XJ,…);

对于任何λ∈k,其中i=6 j。

证据。(1)通过应用两次多语种,我们已经

f(…,Xi+Xi+ 1,Xi+Xi+ 1,…)=f(…,Xi,Xi,…)+f(…,Xi,Xi + 1,…)

+f(…,Xi+1,Xi,…)+F(…,Xi + 1,Xi + 1,…);

既然f是交替的,这就产生了

0=f(…,Xi,Xi+1,…)+f(…,Xi+1,Xi,…);

即F(…,Xi,Xi+1,…)=f(…,Xi+1,Xi,…)。

(2) 如果Xi=XJ和I和J不相邻,则可以交换Xi和Xi + 1,然后交换Xi和Xi + 2等,直到XI和XJ变为相邻。由(1)

其中1,但F(…,Xi,XJ,…)=0,因为Xi=XJ,和(2)成立。

(3) 从(2)开始,如(1)所示。(4)是(2)的直接后果。

6.2。交替多行地图

命题6.3现在将用于显示交替多行图的基本性质。首先,我们需要稍微扩展一下矩阵符号。设e为k上的向量空间。给定n×n矩阵a=(aij)除以k,我们可以定义一个映射l(a):en→en,如下所示:

L(A)1(U)=A11U1+·····+A1nun,

L(A)N(U)=An1U1+····+阿牛,

对于所有的u1,…,un∈e,带有u=(u1,…,un)。立即证实L(a)是线性的。然后,给出两个n×n矩阵a=(aij)和b=(bij),通过重复建立矩阵乘积的计算(定义3.10之前),我们可以证明l(ab)=l(a)l(b)。

然后可以方便地使用矩阵表示法来描述线性映射l(a)的效果,如

网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

引理6.4。让F:E×…×e→f为n-线性交替图。设(u1,…,un)和(v1,…,vn)为n向量的两个族,这样,

V1=A11U1+·····+AN1UN,

…Vn=a1nu1+·····+阿牛。

同等地,让

假设我们有

然后,

其中,和在所有置换πon 1,…,n范围内。

证据。用多线性展开f(v1,…,vn),得到形式的项和。

aπ(1)1···aπ(n)nF(uπ(1),…,uπ(n)),

对于所有可能的函数π:1,…,n→1,…,n。但是,因为f是交替的,所以只有π是置换的项是非零的。在命题6.1中,每个置换π都是转置数的乘积,而在命题6.2中,转置数的奇偶性只取决于π。然后,将命题6.3(3)应用于π中的每一个换位,我们得到

.

因此,我们得到了引理的表达式。

数量

img

实际上是a的行列式的值(我们稍后将看到,它也等于a>的行列式)。然而,直接使用上述定义是相当背道而驰的,我们将通过一条稍微间接的路线继续前进。

6.3行列式的定义

回想一下,在一个k域中,系数为n×n的全平方矩阵的集合用mn(k)表示。

定义6.4.行列式定义为任何映射

d:mn(k)→k,

当把它看作(kn)n上的映射时,也就是说,矩阵n列的映射,是n线性交替的,因此d(in)=1表示中的单位矩阵。等价地,我们可以考虑一个维数为n的向量空间e,一些固定基(e1,…,en),并定义

D:en→k

作为一个n-线性交替映射,使得d(e1,…,en)=1。

首先,我们将证明存在这样的映射D,使用一个归纳定义,也给出了一个递归方法来计算行列式。实际上,我们将定义一个族(d n)n≥1的(有限)映射集d:mn(k)→k。其次,我们将证明行列式实际上是唯一定义的,也就是说,我们将证明每个dn由一个映射组成。这将显示引理6.4的直接定义det(a)与归纳定义d(a)的等价性。最后,我们将用唯一性定理证明行列式的一些基本性质。

给定矩阵a∈mn(k),用a1,…,a n表示其n列。为了描述递归过程来定义一个行列式,我们需要一个小的概念。

定义6.5.对于n≥2的任意n×n矩阵,对于任意两个指数i,j(1≤i,j≤n),让aij为(n-1)×n-1)矩阵,该矩阵通过从a中删除第i行和第j列而获得,称为次矩阵:

网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误
网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误
网络错误

定义6.6.对于每n≥1,我们将映射d:mn(k)→k的有限集dn归纳如下:

当n=1时,d1由单个映射d组成,因此,d(a)=a,其中a=(a),带有a∈k。

假设已经定义了dn−1,其中n≥2。然后,d n由所有的映射d组成,这样,对于某些i,1≤i≤n,

d(a)=(−1)i+1ai1d(a i 1)+······+(−1)i+naind(ain),

其中,对于每个j,1≤j≤n,d(aij)是将dn−1中的任何d应用于未成年人的结果。

Aij。

我们承认,对定义中的dn成员和dn−1成员使用相同的字母d可能会有点混淆。我们考虑使用下标来区分,但这似乎不必要地使事情复杂化。无论如何,我们不应该太担心,因为每个DN只包含一个映射。

每个(−1)i+jd(aij)被称为aij的辅因子,d(a)的诱导表达式根据i行被称为d的拉普拉斯展开式。给定矩阵a∈mn(k),每个d(a)称为a的行列式。

我们可以把dn的每一个成员看作是一个计算a的“行列式”的算法。主要的一点是,这些算法使用所有可能的拉普拉斯行展开递归地计算一个行列式,都会得到相同的结果,det(a)。

我们将很快证明d(a)是唯一定义的(目前还不清楚dn由单个映射组成)。假设这个事实,给定一个n×n矩阵a=(aij),

网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

其行列式用d(a)或det(a)表示,或者更明确地用

img

首先,让我们先考虑一些例子。

例6.1。

1。当n=2时,如果

img

根据任何一行进行扩展,我们有

d(a)=ad−bc。

网络错误
img 网络错误 img

根据第一排展开,我们有

img

也就是说,

d(a)=A11(A22A33−A32A23)−A12(A21A33−A31A23)+A13(A21A32−A31A22),给出了明确的公式

D(A)=A11A22A33+A21A32A13+A31A12A23−A11A32A23−A21A12A33−A31A22A13。

我们现在证明,每个d∈dn都是一个行列式(map)。

引理6.5。对于每个n≥1,对于定义6.6中定义的每个d∈dn,d是一个交替的多行映射,使得d(in)=1。

证据。通过对n的归纳,很明显d(in)=1。现在让我们证明D是多行的。让我们证明d在每一列中是线性的。考虑任何列k。因为

d(a)=(−1)i+1ai1d(a i 1)+··········+(−1)i+jaijd(aij)+·······(−1)i+naind(ain),

如果j=6k,那么通过归纳,d(aij)在k列是线性的,aij不属于k列,所以(−1)i+jaijd(aij)在k列是线性的。如果j=k,那么d(aij)不依赖于k=j列,因为aij是通过删除i行和j=k列而从a获得的,aij属于j=k列。因此,()在K列是线性的。因此,在所有情况下,(-1)i+jaijd(aij)在K列是线性的,因此,d(a)在K列是线性的。

现在让我们证明d是交替的。假设A的两个相邻列相等,例如ak=ak+1。首先,设j=6 k,j=6 k+1。然后,矩阵aij有两个相同的相邻列,根据归纳假设,d(aij)=0。D(a)的其余条款为

(−1)i+kaikd(aik)+(−1)i+k+1aik+1d(aik+1)。

但是,这两个矩阵a i k和aik+1是相等的,因为我们假设a的k列和k+1是相同的,并且因为aik是通过删除行i和列k从a获得的,aik+1是通过删除行i和列k+1从a获得的。同样,aik=aik+1,因为a的k列和k+1相等。但是后来,

(−1)i+kaikd(aik)+(−1)i+k+1aik+1d(aik+1)=(−1)i+kaikd(aik)−(−1)i+kaikd(aik)=0.

这表明d是交替的,并完成了证明。

引理6.5表明行列式的存在。我们现在证明了他们的独特性。

定理6.6.对于每一个n≥1,对于每一个d∈dn,对于每一个矩阵a∈mn(k),我们有

其中,和在所有置换πon 1,…,n范围内。因此,dn由每n≥1的单个映射组成,该映射由上述显式公式给出。

证据。考虑kn的标准基(e1,…,en),其中(ei)i=1和(ei)j=0,对于j=6i,a的每列aj对应于矢量vj,其在基(e1,…,en)上的坐标是aj的分量,也就是说,我们可以写下

v1=a11e1+·····+an1en,

…Vn=a1ne1+·····+annen。

因为通过引理6.5,每个d是一个多行交替映射,通过应用引理6.4,我们得到

其中,和在所有置换πon 1,…,n范围内。但是d(e1,…,en)=d(in),根据引理6.5,我们得到d(in)=1。因此,

其中,和在所有置换πon 1,…,n范围内。

从现在开始,对于一个方阵的行列式,我们倾向于用符号det(a)代替d(a)。

注:行列式的几何解释非常有启发性。给定n个线性无关向量(u1,…,un),集合

pn=λ1u1+····+λnun 0≤λi≤1,1≤i≤n

称为Parallelotype。如果n=2,那么p2是一个平行四边形,如果n=3,那么p3是一个平行六面体,一个倾斜的盒子,它的三个角边是u1、u2、u3。然后,发现det(u1,…,un)是并行端口pn的有符号卷(其中volume表示n维卷)。本卷的符号说明PN在RN中的方向。

我们现在可以证明行列式的一些性质。

推论6.7。对于每个矩阵a∈mn(k),我们有det(a)=det(a>)。

证据。根据定理6.6,我们得到

其中,和在所有置换πon 1,…,n范围内。因为置换是可逆的,所以每个积

aπ(1)1···aπ(n)n

可以重写为

A1π−1(1)····ANπ−1(N)

既然)和的总和被1,…,n上的所有排列占据,我们有

其中π和σ在所有排列上都有范围。但立即证实

.

img

推论6.7的一个有用结果是矩阵的行列式也是其行的多行交替映射。这一事实,再加上矩阵的行列式是其列的多行交替映射这一事实,通常有助于在计算行列式时找到捷径。我们在下面的例子中说明这一点,这个例子在多项式插值中显示。

例6.2。考虑所谓的范德蒙行列式

.

我们声称

当n=1时,v(x1,…,xn)=1。我们通过n≥1上的归纳证明了这一点。案例n=1是显而易见的。假设n≥2。我们按照如下步骤进行:将第n-1行乘以x1,然后将其从第n行(最后一行)中减去,然后将第n-2行乘以x1,然后将其从第n-1行中减去,等等,将第i-1行乘以x1,然后将其从第i行中减去,直到我们到达第1行。我们得到下列行列式:

img

现在,根据第一列展开该行列式并使用多重线性,我们可以通过删除第一行和第一列获得的矩阵I i至1的列(Xi×X1),从而

V(x1,…,xn)=(x2−x1)(x3−x1)···(xn−x1)V(x2,…,xn)

这就建立了诱导步骤。

引理6.4可以很好地重新表述如下。

提案6.8.设f:e×…×e→f为n线性交替图。设(u1,…,un)和(v1,…,vn)为n向量的两个族,这样

V1=A11U1+·····+A1nun,

…Vn=An1U1+·····+阿牛。

网络错误
网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

v1 U1

V2 U2

……=A…。VN联合国

那么,f(v1,…,vn)=det(a)f(u1,…,un)。

证据。与引理6.4的唯一区别是,这里我们使用的是>而不是a。因此,通过引理6.4和推论6.7,我们得到了期望的结果。

因此,我们得到了矩阵乘积的行列式是这些矩阵行列式的乘积这一非常有用的性质。

提案6.9.对于任意两个n×n矩阵a和b,我们有det(ab)=det(a)det(b)。

证据。我们使用命题6.8如下:让(e1,…,en)作为kn的标准基础,并让

w1 e1

w2 e2

。=ab…。

..wn en

然后,我们得到det(w1,…,wn)=det(ab)det(e1,…,en)=det(ab),

因为det(e1,…,en)=1。现在,让

v1 e1

V2 E2

…=B…,

γ

VN EN

我们得到

DET(v1,…,vn)=DET(b)

6.4。逆矩阵和行列式

从那以后

w1 v1

w2 v2

…=A…,

γ

WN VN

我们得到了det(w1,…,wn)=det(a)det(v1,…,vn)=det(a)det(b)。

img

应该注意的是,到目前为止,当k是一个交换环,而不一定是一个场时,这一部分的所有结果也成立。现在我们可以用行列式det(a)来描述一个n×n矩阵a是可逆的。

6.4逆矩阵和行列式

在接下来的两个部分中,k是一个交换环,当需要时,是一个场。

定义6.7.设k为交换环。给定一个矩阵a∈mn(k),让ae=(bij)是定义如下的矩阵:

bij=(−1)i+j det(aj i),第

aj i的辅因子。矩阵ae称为a的调整项,每个矩阵aj i称为矩阵a的次方。

注意指数的逆转

bij=(−1)i+j det(aj i)。

因此,ae是a元素的辅因子矩阵的转置。

我们有以下建议。

提案6.10.设k为交换环。对于每一个矩阵a∈mn(k),我们有

aae=aae=det(a)in.

因此,a是可逆的,如果det(a)是可逆的,那么a−1=(det(a))−1ae。

证据。如果ae=(bij)和aae=(cij),我们知道aae的第一行和第j列中的条目cij是

cij=ai1b1j+·····+aikbkj+····+ainbnj,

等于

ai1(−1)j+1 det(aj 1)+····+ain(−1)j+n det(aj n)。

如果j=i,那么我们根据第i行识别出det(a)的展开式:

cii=det(a)=a i 1(−1)i+1 det(ai1)+·····+a i n(−1)i+n det(ain)。

如果j=6i,我们可以用a的i行替换a的j行来形成矩阵a0。

现在,从A中删除行j和列k得到的矩阵aj k等于从a0中删除行j和列k得到的矩阵,因为a和a0只与第j行不同。因此,

我们有cij=ai1(−1)j+1 det(a0j 1)+······+ain(−1)j+n det(a0j n)。

然而,这是根据j行对det(a0)的展开,因为a0的j行等于a的i行,并且a0有两个相同的i和j行,因为det是行的交替映射(见前面的注释),所以我们得到det(a0)=0。因此,我们已经证明,当j=6i时,cii=det(a),cij=0,因此

.

从a的定义也可以明显看出,

.

然后,将参数的第一部分应用于>,我们将

A>AF>=DET(A>)输入,

从那以后,我们得到

也就是说,

(aae)>=det(a)in,

会产生

aae=Det(a)英寸,

从那以后。这证明了

aae=aae=det(a)in.

因此,如果DET(a)是可逆的,我们有一个−1=(DET(a))−1ae。相反,如果a是可逆的,从aa−1=in,根据命题6.9,我们得到了det(a)det(a−1)=1,det(a)是可逆的。

6.4。逆矩阵和行列式

当k是一个场时,元素a∈k是可逆的,当a=06。在这种情况下,命题的第二部分可以表述为a是可逆的iff det(a)=06。顺便注意一下,这种计算矩阵倒数的方法通常不实用。

我们现在考虑行列式在线性独立性和线性方程组求解中的一些应用。虽然这些结果适用于积分域上的矩阵,但它们的证明需要更复杂的方法(有必要使用积分域的分数域k)。因此,我们再次假设k是一个场。

设a为n×n矩阵,x a列为变量向量,b为另一列向量,a1,…,a表示a的列。观察方程ax=b的系统。

网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

x1a1+····+xjaj+····+xnan=b,

因为在这两种情况下,第i行对应的方程都是

ai1x1+····+aijxj+····+ainxn=bi。

首先,我们用行列式来描述矩阵A的列向量的线性无关性。

提案6.11.给定一个n×n-矩阵a在一个k域上,a列的a1,…,a列与iff det(a)=det(a1,…,an)=0线性相关。相当地,a的秩n iff det(a)=06。

证据。首先,假设列a1,…,a的a是线性相关的。那么,有x1,…,xn∈k,这样

x1a1+····+xjaj+····+xnan=0,

其中xj=06,对于某些j。如果我们计算det(a1,…,x1a1+·················+xnan,…,an)=det(a1,…,0,…,an)=0,

其中0出现在j-th位置,通过多重性,所有包含两个相同列k=6j的项都消失了,我们得到

xj det(a1,…,an)=0.

因为xj=06,k是一个字段,所以我们必须有det(a1,…,an)=0。

相反,我们表明,如果列a1,…,a的a是线性无关的,那么det(a1,…,an)=06。如果a1,…,a的a列是线性无关的,那么它们构成了kn的基,我们可以用下式表示kn的标准基(e1,…,en)。

网络错误
网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误 网络错误

对于一些矩阵b=(bij),通过命题6.8,我们得到

DET(e1,…,en)=DET(b)DET(a1,…,an)

由于det(e1,…,en)=1,这意味着det(a1,…,an)=0(6,det(b)=0)6。对于第二个断言,回想一下,矩阵的秩等于线性无关列的最大数目,并且结论是清楚的。

如果我们把6.11和10.14结合起来,我们就得到了矩阵的秩的下列标准。

提案6.12。给定一个K域上的任意m×n矩阵a(通常k=r或k=c),a的秩是最大自然数r,这样通过选择a的r行和r列得到a的r×r子矩阵b,这样det(b)=06。

6.5线性方程组和行列式

我们现在描述一个形式为ax=b的线性方程组有唯一解的时候。

提案6.13。给定一个域k上的n×n矩阵a,以下属性成立:

(1) 对于每个列向量b,都有一个唯一的列向量x,这样ax=b iff,ax=0的唯一解是平凡向量x=0,iff det(a)=06。

(2) 如果det(a)=06,则由表达式给出ax=b的唯一解。

被称为克莱默法则。

(3) 线性方程组ax=0有一个非零解iff det(a)=0。

6.6。线性映射的行列式

证据。假设ax=b有一个解X0,假设y=0,y=0.6,那么,

A(X0+Y)=Ax0+Ay=Ax0+0=B,

X0+Y=6X0是ax=b的另一个解,包含了ax=b有一个解X0的假设。因此,ax=0只有平凡解。现在,假设ax=0只有平凡的解。这意味着a1,…,a列是线性独立的,根据命题6.11,我们得到了det(a)=0.6。最后,如果det(a)=06,根据命题6.10,这意味着a是可逆的,然后,对于每个b,a x=b等于x=a−1b,这表明ax=b有一个单独的解。

(2) 假设ax=b。如果我们计算det(a1,…,x1a1+·····+xjaj+·····+xnan,…,an)=det(a1,…,b,…,an),

当b出现在j-th位置时,通过多线性,所有包含两个相同列k=6j的项都消失了,我们得到

xj det(a1,…,an)=det(a1,…,aj−1,b,aj+1,…,an)

对于每个j,1≤j≤n。由于我们假设det(a)=det(a1,…,an)=06,我们得到了所需的表达式。

(3) 注意,ax=0有一个非零解iff a1,…,an是线性相关的(如在命题6.11的证明中所观察到的),通过命题6.11,它等于det(a)=0。

尽管克莱默法则令人满意,但用上述表达式求解线性方程组通常是不切实际的。然而,这些公式暗示了一个有趣的事实,即系统ax=b的解在a和b中是连续的。如果我们假设a中的项是连续函数aij(t),b中的项也是实参数t的连续函数bj(t),因为行列式是其项的多项式函数,表达式

img

是多项式的比值,因此只要det(a(t))不为零,它也是连续的。同样,如果函数aij(t)和bj(t)是可微的,那么xj(t)也是可微的。

6.6线性图的行列式

我们用线性映射f:e→e的行列式的概念来结束这一章。

给定一个有限维n的向量空间e,给定e的基(u1,…,un),对于每一个线性映射f:e→e,如果m(f)是f w.r.t的矩阵,基(u1,…,un),我们可以定义det(f)=det(m(f))。如果(v1,…,vn)是e的任何其他基,如果p是基矩阵的变化,根据推论4.5,f关于基(v1,…,vn)的矩阵是p−1m(f)p。现在,根据命题6.9,我们得到了det(p−1m(f)p)=det(p−1)det(m(f))det(p)=det(p−1)det(p)det(m(f))=det(m(f))。

因此,det(f)确实独立于e的基础。

定义6.8.给定一个有限维的向量空间e,对于任意线性映射f:e→e,我们将f的行列式det(f)定义为f的矩阵在任何基础上的行列式det(m(f))(因为在定义之前的讨论中,该行列式不依赖于基)。

那么,我们有以下的建议。

提案6.14.对于任意有限维n的向量空间e,线性映射f:e→e是可逆的iff det(f)=06。

证据。线性映射f:e→e是可逆的,如果它的矩阵m(f)在任何基上都是可逆的(通过命题4.2),iff det(m(f))=06,通过命题6.10。

给定一个有限维N的向量空间,可以很容易地看出,双射线性映射的集合f:e→e使得det(f)=1是一个组合下的群。这个群是一般线性群gl(e)的一个子群。它被称为特殊线性群(e),用sl(e)表示,当e=k n时,用sl(n,k)表示,甚至用sl(n)表示。

6.7凯莱-汉密尔顿定理

我们以一个有趣而重要的6.10命题的应用,即凯莱-汉密尔顿定理,来结束这一章。本节的结果适用于任何交换环k上的矩阵。首先,我们需要矩阵特征多项式的概念。

定义6.9.如果k是任意交换环,对于每一个n×n矩阵a∈mn(k),a的特征多项式pa(x)是行列式。

Pa(x)=DET(Xi—a)。

特征多项式pa(x)是k[x]中的一个多项式,不定x中的多项式环的系数是k。例如,当n=2时,如果

然后

6.7。凯莱-汉密尔顿定理

我们可以用矩阵a代替多项式pa(x)中的变量x,得到矩阵pa。

pa(x)=xn+c1xn−1+····+cn,

然后

PA=AN+C1AN−1+·····+CNI。

我们有以下显著的定理。

定理6.15。(Cayley–Hamilton)如果k是任何交换环,对于每个n×n矩阵

a∈mn(k),如果我们让

pa(x)=xn+c1xn−1+····+cn

是的特征多项式,然后

pa=an+c1an−1+····+cni=0。

证据。我们可以把矩阵B=Xi-A作为矩阵的系数在多项式环k[x]中看,然后我们可以形成矩阵BE,它是元素B的辅因子矩阵的转置。Te B作为

be=xn−1b0+xn−2b1+···+bn−1,

对于一些系数为k的矩阵b0,…,bn-1。例如,当n=2时,我们有

.

根据6.10号提案,我们

bbe=Det(b)i=PA(x)i。

另一方面,我们有

BBE=(Xi~A)(Xn=1B0+Xn=2B1+···+Xn·j=1BJ+···+BN×1);

把右手边乘以,我们得到

bbe=xnd0+xn−1d1+···+xn−jdj+····+dn,

具有

d0=b0 d1=b1−ab0

dj=bj−abj−1

dn−1=bn−1−abn−2 dn−abn−1。

自从

pa(x)i=(xn+c1xn−1+····+cn)i,

平等

xnd0+xn−1d1+····+dn=(xn+c1xn−1+···+cn)i

是两个矩阵之间的等式,因此它要求所有对应的项都相等,并且由于这些项是多项式,因此这些多项式的系数必须相同,这相当于一组方程

i=b0 c1i=b1−ab0

Cji=bj−abj−1

cn-1i=bn-1−abn-2

CNI=−ABN−1,

对于所有j,1≤j≤n-1。如果我们将第一个方程乘以a,最后一个方程乘以i,通常(j+1)th乘以−j,当我们把所有这些新方程相加时,我们看到右边加起来是0,我们得到了我们想要的方程。

AN+C1AN−1+·····+CNI=0,

如要求。

作为一个具体的例子,当n=2时,矩阵

img

满足方程

A2−(A+D)A+(AD−BC)i=0.

大多数读者可能会发现定理6.15的证明相当聪明,但非常神秘,毫无动力。概念上的困难在于,我们真的需要了解一个变量中的多项式是如何“作用”于向量的,就矩阵A而言。这可以做到,并产生一个更“自然”的证明。实际上,如果我们把自己从矩阵中解放出来,而不是考虑有限维向量空间e和一些给定的线性映射f:e→e,那么推理更简单,更一般。给定任意多项式p(x)=a0xn+a1xn−1+········+an和k域中的系数,我们定义线性映射p(f):e→e by

p(f)=a0fn+a1fn−1+····+anid,

6.7。凯莱-汉密尔顿定理

式中,f k=f·····f,f与其自身的k-折叠组成。注意

p(f)(u)=a0fn(u)+a1fn−1(u)+····+anu,

对于每一个向量u∈e,我们用多项式定义了一种新的标量乘法·:k[x]×e→e,对于每一个多项式p(x)∈k[x],对于每一个u∈e,

p(x)·u=p(f)(u)。

很容易证实这是一个“良好的行动”,也就是说

P·(U+V)=P·U+P·V(P+Q)·U=P·U+Q·U

(PQ)·U=P·(Q·U)1·U=U,

对于所有p,q∈k[x]和所有u,v∈e,用这个新的标量乘法,e是k[x]模。如果p=λ只是k中的一个标量(阶数为0的多项式),那么

λ·u=(λid)(u)=λu,

也就是说,K通过标量乘作用于E。如果p(x)=x(单项x),那么

x·u=f(u)。

现在,如果我们选取一个基(e1,…,en),如果一个多项式p(x)∈k[x]具有

p(x)·ei=0,i=1,…,n,

这意味着p(f)(e i)=0,对于i=1,…,n,这意味着线性映射p(f)在e上消失。我们也可以像在6.2节中所做的那样,检查如果a和b是两个n×n矩阵,如果(u1,…,un)是任何n个向量,那么

.

这就提出了我们第二次证明凯莱-汉密尔顿定理的攻击计划。为了简单起见,我们证明了场上向量空间的定理。证明了交换环上自由模的存在。

定理6.16。(Cayley–Hamilton)对于场k上的每个有限维向量空间,对于每个线性映射f:e→e,对于每个基(e1,…,en),如果a是基(e1,…,en)上f的矩阵,如果

pa(x)=xn+c1xn−1+····+cn

是的特征多项式,那么

pa(f)=fn+c1fn−1+····+cnid=0。

证据。由于a的列由表示在基(e1,…,en)上的向量f(ej)组成,我们有

img

利用k[x]对e的作用,上述方程可以表示为

img

会产生

,1≤j≤n。

观察特征多项式的转置出现,因此上述系统可以写成

.

如果我们假设B= Xi→a>,那么如前一个证明,如果是B的余因子矩阵的转置,则

BBE=DET(b)i=DET(Xi→a>)i=DET(Xi→a)i=PAI。

但从那时起

因为Be是一个矩阵,其项是k[x]中的多项式,所以在左边乘Be是有意义的,我们得到

也就是说,

pa·ej=0,j=1,…,n,

如权利要求所述,证明pa(f)=0。

6.8。永久物

如果k是一个场,那么线性映射f:e→e的特征多项式与e中选择的基(e1,…,en)无关。为了证明这一点,观察到对于某些不可数矩阵p,f在另一个基上的矩阵将是p-1ap的形式,然后

属性(XI)

= DET(p=1(Xi(a))p)=DET(p=1)DET(Xi(a))DET(p)=DET(Xiα)。

因此,线性映射的特征多项式是f的固有性质,用pf表示。

线性映射F的特征多项式的零(根)称为F的特征值,在理论和应用中起着重要作用。稍后我们将回到这个主题。

6.8永久性

回想一下,n×n矩阵行列式的显式公式是

.

如果我们从上面的公式中去掉每个排列的符号),我们得到一个称为永久数的量:

每(a)=x aπ(1)1···aπ(n)n。

π∈sn

柯西早在1812年就研究了永久性和决定因素。从上述定义可以清楚地看出,永久形式是多行对称形式。我们也有

每(a)=每(a>),

以及拉普拉斯展开式的以下无符号版本:

每(a)=ai1 per(ai1)+····+aijper(aij)+·····+aiper(ain)

然而,对于i=1,…,n.与行列式不同,行列式有明确的几何解释,作为有符号的体积,永久数没有任何自然的几何解释。此外,行列式可以有效地评估,例如使用行缩减梯队形式的转换,但是计算永久行列式是困难的。

永久的结果是有各种组合的解释。其中之一就是我们现在讨论的二部图的完全匹配。

回想一个二部(无向)图g=(v,e)是一个图,它的节点集v可以分成两个非空的不相交的子集v1和v2,这样每个边e∈e在v1中有一个端点,在v2中有一个端点。图6.8显示了一个具有14个节点的双平面图的示例;其节点被划分为两组x1、x2、x3、x4、x5、x6、x7和y1、y2、y3、y4、y5、y6、y7。

img

图6.1:二部图G。

图G=(V,E)(是否二部)中的匹配是一组成对的非相邻边,这意味着M中没有两个边共享一个公共顶点。完美匹配是这样一种匹配,即v中的每个节点都与匹配m中的某个边相关联(v中的每个节点都是m中某个边的端点)。图6.8显示了二部图G中的完全匹配(红色)。

img

图6.2:二部图G中的完美匹配。

显然,只有当二部图的一组节点在两个大小相等的块(如x1,…,xm和y1,…,ym)中有一个分区时,才能存在完全匹配。然后,在完美匹配和双射π之间有一个双射:{x1,…,xm },{ y1,…,ym },使得π(Xi)=yj-IFF,在Xi和YJ之间有一个边。

现在,每一个二部图G,其节点被划分成两个大小相等的集合,如上图所示,用m×m矩阵a=(aij)表示,这样aij=1iff有一条边

6.9。进一步阅读

在XI和YJ之间,而AIJ=0。利用双射π:x1,…,xm→y1,…,ym的完美机械的解释,我们看到表示二部图g的(0,1)矩阵a的永久per(a)计数g中的完美匹配数。

在1979年出版的一篇著名论文中,LeslieValiant证明了计算永久性是一个P-完全问题。这些问题被怀疑是难以解决的。众所周知,如果存在一个多项式时间算法来解决一个p-完全问题,那么我们将得到p=np,这被认为是非常不可能的。

另一种对恒量的组合解释可以用不同代表的系统来解释。给定一个有限集s,让(a1,…,an)是s的任何非空子集序列(不一定是不同的)。集合a1,…,a n是n个不同元素(a1,…,an)的序列,a i∈ai表示i=1,…,n,集合序列的sdr个数在组合数学中起着重要作用。现在,如果s=1,2,…,n并且如果我们关联到s的非空子集的任何序列(a1,…,an),那么矩阵a=(ai j)定义为aij=1,如果j∈ai和aij=0,那么永久per(a)计算集合a1,…,an的sdr的数量。

用SDR解释永久性可以用来证明各种矩阵的永久性的界限。感兴趣的读者可参考van Lint和Wilson[174](第11章和第12章)。特别是,在第12章中给出了一个被称为范德瓦尔登猜想的定理的证明。这个定理指出,对于任何n×n矩阵a,其中所有的行和和列和都是1(双随机矩阵),我们有

每,(

其中所有项都等于1/n的矩阵的等式。

6.9进一步读数

第3-5章和第6章所述材料的详细论述可在Strang[165,164]、Lax[110]、Lang[106]、Artin[7]、Mac Lane和Birkhoff[115]、Hoffman和Kunze[99]、Bourbaki[25,26]、van der Waerden[173]、Serre[151]、Horn和Johnson[92]和Bertin[15]中找到。线性代数的这些概念很好地应用于古典几何,见Berger[11,12]、Tisseron[170]和Dieudonn’e[50]。