说明
- 本文主要为对线性代数中线性空间知识的思路梳理,先介绍了线性方程组的解法,再介绍抽象的线性空间,然后研究线性空间及其子空间的结构。本文内容主要来自对丘维声教授的《高等代数》的整理,原书中在介绍了线性方程组的解法之后,紧接着是行列式,但这一部分和线性空间的交集并不多,所以笔者暂时省略。如果在线性空间部分中涉及到的行列式相关定理,笔者会作出说明。笔者建议,在阅读MIT线性代数笔记10之前,能够先阅读此文进行知识回顾。
- 本文主要为知识回顾和缕清思路,会包含大量【定理】【命题】【推论】,但定理大部分并不会标注出来,只会在个别重要定理前面标注【定理】,同时以
结尾。同时会标注定理或命题在书籍中相应的位置,比如,定理在书中第20页,即【定理 P20】,以便读者方便查阅原书的证明过程。
- 本文目前仍在持续更新中,目前为第一版 v1.0。初步的目的是更新完线性空间的章节,而关于行列式、矩阵计算等其他内容本文不会涉及,但本文会引用一些这些章节中的比较常用的定理。
- 为了统一书写和阅读方便,本文中线性空间的向量均以小写希腊字母简记(除非有特殊说明),即
,标量均以小写英文字母简记,即
,而对于零,标量零通常写作 0 ,零向量和零子空间通常写作
,也就是说读者需要自己区分看到的零是标量,还是零向量,还是零子空间。
- 本文经常会用几何空间做类比,对于几何空间中的向量,通常用
和
来表示。
- 下标:之前MIT线性代数笔记中,我们一般使用
型矩阵
,此笔记多使用
型矩阵
。
- 在 MIT线性代数中,简化行阶梯形矩阵用
来表示,本文中行阶梯形矩阵和简化行阶梯形矩阵均以
表示。
线性方程组
我们都知道,研究线性代数的初始需求来自于解 元线性方程组,它的一般形式是:
因为未知量最高次数为 1 ,所以我们借鉴平面几何中,当 不全为 0 时
表示一条直线的说法,称方程组为线性方程组;等号右端
不全为 0 ,称为非齐次线性方程组,
时称为齐次线性方程组。
而我们研究线性方程组时,需要关注以下几个问题:
- 线性方程组是否有解?
- 如何求线性方程组的解?
- 线性方程组有解时,解的结构如何?
高斯消元法
为了方便求解,我们将(1)中系数和常数项单独拿出来得到了系数矩阵 和
,
为对应的增广矩阵。
高斯消元法:对 或
进行初等行变换,得到行阶梯型矩阵
。
高斯-若当消元法:继续对阶梯型矩阵进行初等行变换,得到简化行阶梯形矩阵 。
对(简化)行阶梯形矩阵 ,主元所在列对应的未知量称为基变量,非主元列对应的未知量称为自由变量。
因为矩阵的初等行变换得到的方程组与原来的方程组同解,所以我们可以利用简化行阶梯形矩阵对应的方程组来得到原方程组的解。
并且有以下【定理1 P20】:
系数和常数项为有理数(或实数,或复数)的 元线性方程组的解的情况有且仅有三种可能:无解,有唯一解,有无穷多个解。把
元线性方程组的增广矩阵经过初等行变换化成阶梯型矩阵,如果相应的阶梯型方程组出现
(其中
是非零数)这种方程,那么原方程组无解;否则,有解。当有解时,如果阶梯型矩阵的非零行数目
等于未知量的数目
,那么方程组有唯一解;如果
,那么方程组有无穷多个解。
这样,我们就通过对系数矩阵初等行变换得到阶梯型矩阵的方式,初步解决了上节提出的问题。
但紧接着我们产生了两个问题:
- 我们之前求解线性方程组似乎都默认未知数
,就能够进行高斯消元法。那么对线性方程组的系数和未知数本身有什么要求才能保证高斯消元法能够顺利进行呢?
- 能否不通过繁琐的初等行变换,直接通过系数矩阵
或
判断线性方程组的解的情况呢?
对第一个问题,我们引入数域的概念;对第二个问题,我们引入了行列式(本文不作介绍)。
数域
把线性方程组的增广矩阵经过初等行变换化成简化行阶梯形矩阵时,需要做加法、减法和乘法运算,并且要求每个非零数有倒数(因为对于非零行,我们要用一个非零数乘该行,使得这一行的主元为 1,而对于非零数 ,有
)。
在有理数集(或实数集,或复数集)中,可以做加法、减法、乘法运算,并且每个非零数有倒数(即非零数 的倒数
仍在这个数集中)。而在整数集
中,虽然可以做加法、减法、乘法运算,但是 2 的倒数
不是整数,于是在整数集中,
无解,即
没有整数解。为了不影响线性方程组的求解,所考虑的数集应当可以做加法、减法、乘法运算,并且每个非零数的倒数仍在这个数集中。由此引出下述概念:
【定义 P24】复数集的一个子集 如果满足:
;
- 若
,则
;
- 对于
中每个非零数
,有
,那么称
是一个数域。
有理数集 ,实数集
,复数集
都是数域,把它们分别称为有理数域,实数域,复数域。并且【命题 P25】任一数域都包含有理数域,即有理数域是最小的数域。
今后,我们总是取定一个数域 。数域
上的线性方程组是指它的系数和常数项都是
中的数,从而它的每一个解(如果有的话)都是由
中的数组成的有序数组。
数域 上的矩阵是指这个矩阵中的每个数都属于
。对数域
上的矩阵做初等行变换时,“倍数”、“非零数”都是
中的数。
【定理1】对于任一数域 上的线性方程组都成立。
线性空间
回到最初的起点,我们研究求解 元线性方程组,为了计算简便,我们只写出增广矩阵
并对其进行初等行变换得到阶梯型矩阵,由于阶梯型矩阵所对应的方程组和原方程组同解,来方便地得到原方程组是否有解、以及解的结构。所以,关键在于初等行变换导致同解这个过程,接下来我们再考虑这个过程,这个过程包含两个基本要素:每一行有序数组,以及行之间的运算。
我们可以将系数矩阵或增广矩阵的每一行有序数组看做一个行向量 ,并将这
个行向量组成一个集合
。行之间的运算(初等行变换)是:①某一行加上另一行的倍数;②交换某两行;③某一行乘一个数。
由于集合元素具有无序性,所以可以暂时不考虑②,那么①和③其实定义了两种运算:加法运算和数乘运算。①相当于先对另一行进行数乘运算,再进行加法运算;③相当于进行数乘运算。
更重要的是经过了这两种运算,它们对应的线性方程组同解。从而我们可以知道基变量、自由变量,并求出原方程组的通解的表达式。
那么我们就可以考虑,任意一个集合,集合的元素间定义了加法运算和数乘运算,并满足一些要求。这样的集合,无论元素是有序数组,还是矩阵甚至是函数,是否有一些共通的优良性质?这个集合的结构是否都有共同的特点?虽然还未给出具体的定义,但我们称这一类集合为线性空间,我们要研究的就是线性空间和其子空间的诸多定义、性质和本身结构的问题。
为了定义线性空间,首先回顾一些概念:
映射
设 是两个非空集合,若对
中的任一元素
, 依照某种规律(或法则)
, 恒有
中的唯一确定的元素
与之对应,则称对应规律
为一个从
到
的映射。记作:
,有时记:
。
称 为
的像,记作
#card=math&code=y%20%3D%20f%28x%29&height=16&width=50) , 并称
为
的原像。集合
称为映射
的定义域(domain),集合
称为
的像集或陪域(codomain)。集合
%7Cx%5Cin%20A%5Cright%5C%7D#card=math&code=R_f%20%3D%20%5Cleft%20%5C%7Bf%28x%29%7Cx%5Cin%20A%5Cright%5C%7D&height=17&width=112) 称为映射
的值域。
若 %3DB#card=math&code=f%28A%29%3DB&height=16&width=56) ,则
为一个满射;
若 中不同元素在
中的像不同,则
为单射;
若 既是单射又是满射,则称
为一个双射或一一对应映射。
笛卡尔积
在数学中,两个集合 和
的笛卡儿积(cartesian product),又称直积,在集合论中表示为
,是所有可能的有序对组成的集合,其中有序对的第一个对象是
的成员,第二个对象是
的成员。
%7Ca%5Cin%20S%2Cb%20%5Cin%20M%5C%7D%0A%5Ctag%7B2%7D%0A#card=math&code=S%C3%97M%3A%3D%5C%7B%20%28a%2Cb%29%7Ca%5Cin%20S%2Cb%20%5Cin%20M%5C%7D%0A%5Ctag%7B2%7D%0A&height=16&width=583)
称为 与
的笛卡尔积。
代数运算
有了映射和笛卡尔积这两个概念,我们就可以定义代数运算。代数运算的本质是两个元素通过一定的法则得到一个元素,定义如下:
设 为三个非空集合,给出一个映射
,称为
与
到
的一个代数运算。
比如, 都是整数集的运算,但
不是整数集的运算。
线性空间的定义
有了以上概念基础,我们便可以定义线性空间:
设 是一个非空集合,
是一个数域。
如果 上有一个运算,称为加法运算,即
%20%5Crightarrow%20%5Calpha%20%2B%20%5Cbeta#card=math&code=V%20%5Ctimes%20V%20%5Crightarrow%20V%20%3A%20%28%5Calpha%20%2C%5Cbeta%20%29%20%5Crightarrow%20%5Calpha%20%2B%20%5Cbeta&height=16&width=167)
与
之间有一个运算,称为数乘运算,即
%20%5Crightarrow%20k%5Calpha#card=math&code=K%20%5Ctimes%20V%20%5Crightarrow%20V%20%3A%20%28k%20%2C%5Calpha%20%29%20%5Crightarrow%20k%5Calpha&height=16&width=151)
并且满足下述的 8 条运算法则:
,即加法交换律。
%20%2B%20%5Cgamma%20%3D%5Calpha%20%2B%20(%5Cbeta%20%2B%20%5Cgamma)%20%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%2C%20%5Cbeta%20%2C%20%5Cgamma%20%5Cin%20V#card=math&code=%28%5Calpha%20%2B%20%5Cbeta%29%20%2B%20%5Cgamma%20%3D%5Calpha%20%2B%20%28%5Cbeta%20%2B%20%5Cgamma%29%20%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%2C%20%5Cbeta%20%2C%20%5Cgamma%20%5Cin%20V&height=16&width=236) ,即加法结合律。
中有一个元素记作
,
,即零元。
- 对于
,存在
,使得
,
为
的负元。
%5Calpha%3Dk(l%5Calpha)%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%20k%2Cl%20%5Cin%20K%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%5Cin%20V#card=math&code=%28kl%29%5Calpha%3Dk%28l%5Calpha%29%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%20k%2Cl%20%5Cin%20K%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%5Cin%20V&height=16&width=201)
%5Calpha%3Dk%5Calpha%2Bl%5Calpha%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%20k%2Cl%20%5Cin%20K%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%5Cin%20V#card=math&code=%28k%20%2B%20l%29%5Calpha%3Dk%5Calpha%2Bl%5Calpha%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%20k%2Cl%20%5Cin%20K%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%5Cin%20V&height=16&width=232)
%20%3D%20k%5Calpha%20%2B%20k%5Cbeta%2C%20%5Cspace%20%5Cforall%20%5Cspace%20k%20%5Cin%20K%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%5Cin%20V#card=math&code=k%28%5Calpha%20%2B%20%5Cbeta%29%20%3D%20k%5Calpha%20%2B%20k%5Cbeta%2C%20%5Cspace%20%5Cforall%20%5Cspace%20k%20%5Cin%20K%2C%20%5Cspace%20%5Cforall%20%5Cspace%20%5Calpha%20%5Cin%20V&height=16&width=227)
那么称 是数域
上的一个线性空间。
也就是说一个非空集合 ,如果定义了加法和数乘两种运算,并且满足加法上的四条运算法则(前四条),数量乘法上的四条运算法则(后四条),则称
是数域
上的一个线性空间。
数域 上的线性空间
是一个抽象的数学模型。我们并没有规定集合
中的元素的类型,它可以是几何空间中的向量,也可以是矩阵,甚至可以是多项式和微分方程的解等等;同样我们也没有规定所谓的加法运算和数量乘法就算具体是什么形式,只是要求这两种运算要符合 8 条运算法则。
为什么要研究抽象的数学模型呢?因为一旦把它的性质和结构研究清楚了,那么凡是符合这个模型的具体对象的线性空间也都具有这些性质和这样的结构。
抽象的线性空间一时不好理解,那么我们可以举几个例子:
几何空间
我们自然而然首先想到:
【例1】几何空间,即以定点 为起点的所有向量组成的集合,有向量的加法运算和数乘向量运算(即数量乘法运算),并且也满足上述的 8 条运算法则。所以几何空间是实数域
上的一个线性空间。
【例2】取定了一个空间直角坐标系后,每个向量有唯一的坐标,它是有序 3 元实数组,向量的坐标也有加法运算和数量乘法运算,且满足上述 8 条运算法则。所以几何空间中的向量的坐标组成的集合 是实数域
上的一个线性空间。
于是借用几何语言,把线性空间 的元素称为向量,线性空间又可称为向量空间。
n 维向量空间
【例3】数域 上所有
元有序数组组成的集合
%7Ca_i%20%5Cin%20K%2C%20i%3D1%2C2%2C…%2Cn%20%5C%7D%0A%5Ctag%7B3%7D%0A#card=math&code=K%5En%3D%5C%7B%20%28a_1%2Ca_2%2C…%2Ca_n%29%7Ca_i%20%5Cin%20K%2C%20i%3D1%2C2%2C…%2Cn%20%5C%7D%0A%5Ctag%7B3%7D%0A&height=16&width=583)
若定义加法运算:
%2B(b_1%2Cb_2%2C…%2Cb_n)%3A%3D(a_1%2Bb_1%2Ca_2%2Bb_2%2C…%2Ca_n%2Bb_n)%0A%5Ctag%7B4%7D%0A#card=math&code=%28a_1%2Ca_2%2C…%2Ca_n%29%2B%28b_1%2Cb_2%2C…%2Cb_n%29%3A%3D%28a_1%2Bb_1%2Ca_2%2Bb_2%2C…%2Ca_n%2Bb_n%29%0A%5Ctag%7B4%7D%0A&height=16&width=583)
定义数乘运算:
%3A%3D(ka_1%2Cka_2%2C…%2Cka_n)%0A%5Ctag%7B5%7D%0A#card=math&code=k%28a_1%2Ca_2%2C…%2Ca_n%29%3A%3D%28ka_1%2Cka_2%2C…%2Cka_n%29%0A%5Ctag%7B5%7D%0A&height=16&width=583)
则 是数域
上的一个线性空间。
通常称 是数域
上的
维向量空间,
的元素
#card=math&code=%28a_1%2Ca_2%2C…%2Ca_n%29&height=16&width=87) 称为一个
维向量,其中
称为第
个分量,
,两个
维向量相等规定为它们对应的分量都相等。
的零元是
#card=math&code=%280%2C0%2C%E2%80%A6%2C0%29&height=16&width=66),称它为零向量,记作
。
的元素(即
元有序数组)用小写希腊字母的简记,即
注意,为了统一书写和阅读方便,本文中的线性空间的向量均以小写希腊字母简记(除非有特殊说明),标量均以小写英文字母简记,即
。而对于零,标量零通常写作 0 ,零向量和零子空间通常写作
,也就是说读者需要自己区分看到的零是标量,还是零向量,还是零子空间。
元有序数组可以写成一行:
#card=math&code=%28a_1%2Ca_2%2C…%2Ca_n%29&height=16&width=87),称为行向量;也可以写成一列:
%0A%5Ctag%7B6%7D%0A#card=math&code=%5Cleft%20%28%0A%5Cbegin%7Bmatrix%7D%0A%0Aa_1%5C%5C%0Aa_2%5C%5C%0A…%5C%5C%0Aa_n%0A%5Cend%7Bmatrix%7D%0A%5Cright%20%29%0A%5Ctag%7B6%7D%0A&height=73&width=583)
行向量可以看作是列向量的转置。 可以看成是
维行向量组成的向量空间,也可以看成是
维列向量组成的向量空间。他们的性质是一样的,他们的结构也是一样的,只是写法不同而已。习惯上,我们通常都使用列向量进行分析和计算,需要使用行向量时,将其看做列向量的转置即可。
实值函数
设 是实数集的一个非空子集,以
为定义域的所有实值函数(即
到
的所有映射)组成的集合记作
,它对于函数的加法,即
(x)%3A%3Df(x)%2Bg(x)%2C%20%5Cspace%20%5Cforall%20%5Cspace%20x%20%5Cin%20X%0A%5Ctag%7B7%7D%0A#card=math&code=%28f%2Bg%29%28x%29%3A%3Df%28x%29%2Bg%28x%29%2C%20%5Cspace%20%5Cforall%20%5Cspace%20x%20%5Cin%20X%0A%5Ctag%7B7%7D%0A&height=16&width=583)
以及对于实数与函数的数量乘法,即
(x)%3A%3Dkf(x)%2C%20%5Cspace%20%5Cforall%20%5Cspace%20x%20%5Cin%20X%0A%5Ctag%7B8%7D%0A#card=math&code=%28kf%29%28x%29%3A%3Dkf%28x%29%2C%20%5Cspace%20%5Cforall%20%5Cspace%20x%20%5Cin%20X%0A%5Ctag%7B8%7D%0A&height=16&width=583)
是实数域 上的一个线性空间。
的零元素是零函数,记作
,即
%3D0%2C%20%5Cspace%20%5Cforall%20%5Cspace%20x%20%5Cin%20X#card=math&code=0%28x%29%3D0%2C%20%5Cspace%20%5Cforall%20%5Cspace%20x%20%5Cin%20X&height=16&width=106) 。