线性代数基础 - 空间：从向量和基底谈起 - 《机器学习笔记》

向量基础概念回顾
- 向量的几何含义
  - 充当数据的载体
  - 注意：我们一般使用列向量
向量的 Python 表示
- 表示成行向量
- 如何表示列向量
运用向量进行运算
向量的线性组合
关于向量坐标的讨论
- 向量的坐标取决于基底
- 同一向量在不同基底上表示为不同坐标
基底的特殊性
张成空间
- 用平行的概念理解线性相关
- 总结

向量基础概念回顾

向量的几何含义

向量对于大家而言一定不陌生，它的概念很简单，把数字排成一行或一列就是向量。它是描述空间的有力工具。
比如二维向量：空间：从向量和基底谈起 - 图1 ，它有两个成分：第一个成分是 4，第二个成分是 5。一方面，我们可以把它理解成二维平面中 x 坐标为 4，y 坐标为 5 的一个点，也可以理解为以平面原点 (0,0) 为起点，到目标终点 (4,5) 的有向线段，如图 1 所示：
空间：从向量和基底谈起 - 图2
由此可见，向量中成分的个数就是向量的维数。因此，我们进一步推广下去，还会有三维向量，如：空间：从向量和基底谈起 - 图3 ，它用来表示三维空间中的一个点，或者在三维空间中以原点 (0,0,0) 为起点，到目标终点 (3,2,4) 的有向线段，如图 2 所示。当然，以此类推还有更高维的向量。
空间：从向量和基底谈起 - 图4

充当数据的载体

当然，向量不仅仅局限于描述空间中的点坐标和有向线段，它也可以作为描述事物属性的数据载体。比如一次考试中你的成绩为：语文 85 分、数学 92 分、外语 89 分。由于这三门课分属于你的不同科目属性，因此我们可以使用一个三维向量对其进行表示：
空间：从向量和基底谈起 - 图5
又如，在自然语言处理中，程序在进行文本阅读时，首先就会进行文本分词，然后使用向量进行表示。这是因为向量很适合在高维空间中进行表达和处理。在本书后续内容中将接触到的投影、降维等概念，都是在向量的基础上实现的。

注意：我们一般使用列向量

根据刚才我们所讲的，把数字排成一行或一列就是向量。因此向量拥有两种表达方式：像空间：从向量和基底谈起 - 图6 、空间：从向量和基底谈起 - 图7 这种元素竖排的，称为列向量，对应的元素横排的称为行向量，比如：空间：从向量和基底谈起 - 图8 我们在实际使用向量工具进行描述和计算的时候，具体使用哪一种方式呢？在没有特殊说明的情况下，我们提到向量，都是默认为列向量。在文字排版的时候，由于列向量比较占空间，也可以将其写成行向量的转置：
空间：从向量和基底谈起 - 图9
如果我们从直觉上来看，似乎行向量更为直观，这里为什么如此偏爱列向量呢？这么做主要是为了方便后续的向量坐标变换、映射等计算。

将一个矩阵 A 所表示的线性映射作用于某向量 x 时，我们习惯于将其写成矩阵乘以向量的形式——Ax，而这种写法的运算基础便是：x 是一个列向量。

这里一下子堆上来好几个概念，比如转置、矩阵、线性变换等等，都先不急着展开，后面会一一详细描述。这里就请先记住：一般我们都用列的形式来表示向量。

向量的 Python 表示

表示成行向量

对应地，我们如何用 Python 来表示行向量和列向量呢？这里我们需要使用 NumPy 工具包。

import numpy as np
X = np.array([2,4,6,8])
X

Python 中用 NumPy 库来生成一个向量，默认生成的是行向量，但正如我们上面所说的，一般情况下我们通常使用的是列向量，因此还需要对其做一些处理。
你的第一感觉可能会想，用一用转置这个概念（后面会详细讲解）是不是就可以了，也就是把向量的行索引和列索引交换位置，但是 NumPy 中的转置方法在一维向量里是无效的。

import numpy as np
X = np.array([2,4,6,8])
print(X.transpose())

我们发现，确实没有起到效果。

如何表示列向量

那我们应该如何来表示一个列向量呢？
这里我们要事先用一点后面的知识，我们把向量看作是一维的数组，但是也可以看做是行为 1 或者列为 1 的二维数组，用后面的内容来描述，即向量可以看作是特殊的矩阵。行向量是 1×m的矩阵，列向量是 n×1的矩阵，我们用这个视角重新生成一个新的行向量和列向量。

import numpy as np
X = np.array([[2,4,6,8]])
X.T

这里需要注意一个细节，当需要对行向量X进行转置操作时，需要用两层[],先将行向量x转化为矩阵形式，即单层[]形式为向量，而两层[[]]则为矩阵，才能对X求得转置后的按列排布的矩阵形式。

运用向量进行运算

明确了向量的表示方法，那么接下来我们来梳理一下向量的基本运算，我们逐一介绍向量的加法、向量的数量积和向量间的乘法。

向量的加法

两个维数相同的向量才能进行加法运算，将相同位置上的元素相加即可，结果向量的维数保持不变：
空间：从向量和基底谈起 - 图13
向量的加法运算很简单，我们具体来举个例子：

import numpy as np
u = np.array([[1,3,5]]).T
v = np.array([[2,4,6]]).T
print(u + v)

向量的数量乘法

向量的数量乘法就是将参与乘法运算的数和向量的每个元素分别相乘，结果向量保持维数不变，数量乘法就是将向量沿着所在直线的方向拉长到相应的倍数，方向和参与运算的数字的正负号相关：
空间：从向量和基底谈起 - 图15
请看举例:

u = np.array([[1, 3, 5]]).T
3*u

向量的内积

介绍完向量的加法和数量乘法，这里大家一定会问了，那向量和向量相乘呢？向量与向量的乘法分为所谓的点积（内积）和叉积（外积），我们先说点积。
向量 u 和向量 v 的内积定义如下：
空间：从向量和基底谈起 - 图17
这个定义看上去很简单，好像没什么特殊含义。但是，它的另一种表示方法所含的物理意义就十分清晰：u⋅v=|u||v|cosθu⋅v=|u||v|cosθ，如图 3 所示：
空间：从向量和基底谈起 - 图18
即：向量 u 在向量 v 方向上的投影长度乘上向量 v 的模长，换句话说，如果 v 是单位向量的话，就可以直接描述为 u 在 v 方向上的投影长度。

向量内积的几何意义

表征或计算两个向量之间的夹角
b向量在a向量方向上的投影

需要注意的是，我们在实际计算向量点积时，无论是行向量间的点积还是列向量间的点积，其运算结果都是一样的。
Python 中计算向量的点积非常方便。但是需要注意，如果我们直接使用 NumPy 函数库中的点积方法 np.dot()，那么内积运算函数 dot 中的参数要求必须是一维行向量：

u = np.array([3, 5, 2])#注意这里是单层括号，u和v都是行向量
v = np.array([1, 4, 7])
print(np.dot(u, v))

如果这里向量u和向量v仍然用双层括号也就是矩阵的形式计算点积会是什么情况呢？

u = np.array([[1,3,5]]).T
v = np.array([[2,4,6]]).T
print(np.dot(u, v))

这种向量的表示方法本质上其实是矩阵，只不过是行数或者列数为 1 的特殊矩阵，将这种方法表示下的向量作为 dot 函数的参数，就需要依据矩阵的乘法法则来计算，依据矩阵乘法法则判定就会报错，至于为什么会出错，后面的小节会重点讲述，那么怎么样才能得到正确的结果呢，这里先提前预告一下：

u = np.array([[1,3,5]])
v = np.array([[2,4,6]]).T
print(np.dot(u, v))

看上去得到了一个正确的数值结果，至于为什么外面围着两层中括号，同样的，看完后面的内容就会明白。

向量的外积

我们只讨论二维平面和三维空间中的向量外积也就是叉积，在二维平面中：
空间：从向量和基底谈起 - 图22
同样地，还有另一种表达式，看起来物理意义会更直观一些：u⋅v=|u||v|sinθu⋅v=|u||v|sinθ，如图 4 所示。这表示两个向量张成的平行四边形的面积，当然，这里的面积要打引号，因为如果两个向量的夹角大于 180°，则结果为负。
空间：从向量和基底谈起 - 图23

向量外积的几何意义

在三维几何中，向量a和向量b的外积结果称为法向量，该向量垂直于a和b向量构成的平面。在3D图像学中，外积的概念非常有用，可以通过两个向量的外积，生成第三个垂直于a，b的法向量，从而构建X、Y、Z坐标系。如下图所示：

我们用Numpy库中的np.cross()方法求二维空间中向量的外积:

import numpy as np
u = np.array([3, 5])
v = np.array([2, 4])
print(np.cross(u, v))

在三维空间中，外积的计算要相对复杂一些，其计算的结果是一个向量而不是一个数值:

u = np.array([3, 5, 2])
v = np.array([1, 4, 7])
print(np.cross(u, v))

向量的线性组合

在向量加法和数量乘法的基础上，我们将其组合应用，就过渡到向量的线性组合相关内容。针对向量 u 和 v，我们先求数字 c 和向量 u 的数量积，再求数字 d 和向量 v 的数量积，最后将二者叠加，就得到了 u 和 v 的线性组合 cu+dv，这里 c 和 d 可以取任意值（包括 0 ）。
我们再举一个三个三维向量线性组合的例子：
空间：从向量和基底谈起 - 图27
空间：从向量和基底谈起 - 图28
其中，c、d、e 可以取包含 0 在内的任意值。
在这里，我们也举个例子来对几个已知的向量进行线性组合：

u = np.array([[1, 2, 3]]).T
v = np.array([[4, 5, 6]]).T
w = np.array([[7, 8, 9]]).T
print(3*u+6*v+9*w)

现在我们思考一下下面几个线性组合的图像。我们知道，两个向量相加，在几何上就是将两个向量首尾依次连接，结果向量就是最初的起点和最终的终点的有向连线。我们假定有三个非零的三维向量：
空间：从向量和基底谈起 - 图30
我们讨论一下这三个非零三维空间向量所有可能的线性组合。
情况一，cu 的所有线性组合的图像：

由于 c 可以取任意实数包括0，因此 cu 的所有线性组合可以表示为三维空间中一条穿过原点 (0,0,0) 的直线，我们可以把cu理解为向量u被放大或缩小了c倍，如果c为负数，则可以认为向量u被放大或者缩小了相反方向c倍如图 5 所示：

空间：从向量和基底谈起 - 图31
情况二，cu+dv 的所有线性组合的图像：

当向量 u 和 v 不在一条直线上时，cu+dv 表示三维空间中的一个通过原点 (0,0,0) ，右向量cu和向量dv所张成的二维平面，如图 6 所示：

空间：从向量和基底谈起 - 图32

当向量 u 和 v 处在一条直线上时，cu+dv 的图像退化成情况一。

情况三，cu+dv+ew 的所有线性组合的图像：

当向量 u、v、w 不在一个平面上时，cu+dv+ew 可以表示由三个向量cu，dv和ew张成的整个三维空间；
当向量 u、v、w 处在一个平面上时，cu+dv+ew 的图像退化成情况二；
当向量 u、v、w 处在一条直线上时，cu+dv+ew 的图像退化成情况一。

我们在讨论上述多种情况时，反复提到了共线、共面的概念，这些性质会对一组向量线性组合的结果向量的空间位置分布产生较大影响，是线性代数中非常关键的概念，在后续的内容中，我们会围绕它开展深入的讨论，不过我们会使用更加专业的词汇来进行描述和介绍，即：线性相关和线性无关。

关于向量坐标的讨论

向量的坐标取决于基底

对于向量空间：从向量和基底谈起 - 图33 而言，我们一直以来都很理所应当的认为：它表示一条在 x 轴上投影为 4，y 轴上投影为 5 的有向线段，它的坐标是 (4,5)。这其实是基于了一个我们没有刻意强调的前提：我们是利用了方向为 x 轴、 y 轴正方向并且长度为 1 的两个向量空间：从向量和基底谈起 - 图34 和空间：从向量和基底谈起 - 图35 作为讨论的基准。因此，对向量 u 的完整写法就是：空间：从向量和基底谈起 - 图36 ，空间：从向量和基底谈起 - 图37 。
这里被选中作为向量 u 基准的一组向量是向量空间：从向量和基底谈起 - 图38 、向量空间：从向量和基底谈起 - 图39 ，它们被称作是基底，基底的每一个成员称作是基向量。而坐标，就对应的是各基向量前的系数。一般情况下，如果不做特殊说明，基向量都是选取沿着坐标轴正方向且长度为 1 的向量。
因此关于向量 u 的完整准确的说法是：在基底空间：从向量和基底谈起 - 图40 和空间：从向量和基底谈起 - 图41 下，其坐标是空间：从向量和基底谈起 - 图42 。也就是说，坐标必须依托于指定的基底才有意义。因此，要想准确地描述向量，首先要确定一组基，然后通过求出向量在各个基向量上的投影值，最终才能确定在这个基上的坐标值。

同一向量在不同基底上表示为不同坐标

一个指定的向量可以在多组不同的基底上进行坐标表示，在不同的基底表示下，坐标自然也是不同的。根据一组基底对应的坐标去求另一组基底对应的坐标，这就是我们后面会反复用到的坐标变换。
例如，我们可以选择不使用默认的基底空间：从向量和基底谈起 - 图43 和空间：从向量和基底谈起 - 图44 ，而选择这两个看似普通的向量空间：从向量和基底谈起 - 图45 和空间：从向量和基底谈起 - 图46 作为新的基底。
根据向量内积的介绍，我们最好是把基向量的模长转化为 1，因为如果模是 1，那么就可以用目标向量点乘基向量，从而直接获得其在这个基向量上的对应坐标。实际上对应任何一个向量，找到其同方向上模为 1 的向量并不难，只要让向量的各成分分别除以向量模长就好了。
例如，上面的基可以变为空间：从向量和基底谈起 - 图47 和空间：从向量和基底谈起 - 图48
现在，我们来用上面的方法求取向量空间：从向量和基底谈起 - 图49 在这组新基上的新坐标。那么根据向量内积的几何意义，我们只要分别计算空间：从向量和基底谈起 - 图50 和两个新的基向量空间：从向量和基底谈起 - 图51 和空间：从向量和基底谈起 - 图52 的内积即可。不难得到：
空间：从向量和基底谈起 - 图53 , 空间：从向量和基底谈起 - 图54
向量的坐标是指定基底的对应系数，因此向量 u 在新的基底下表达式可以写作：
空间：从向量和基底谈起 - 图55
在该基底下，新的坐标表示为：
空间：从向量和基底谈起 - 图56
图 7 描述了利用上述两组不同的基底，对同一向量进行坐标表示的情况。
空间：从向量和基底谈起 - 图57
空间：从向量和基底谈起 - 图58

基底的特殊性

不是任何向量都能选作基底

在二维平面里，任意取两个向量是否都能作为基底去表示目标向量呢？我们看一个实际例子。
例如：我们尝试选取向量空间：从向量和基底谈起 - 图59 和空间：从向量和基底谈起 - 图60 来作为空间的基底，但是我们发现，无论如何都找不出两个系数，将目标向量 u 表示为这两个向量的线性组合形式，即：满足等式空间：从向量和基底谈起 - 图61 = 空间：从向量和基底谈起 - 图62 + 空间：从向量和基底谈起 - 图63 和成立的 c 和 d 是不存在的，因此它们不能作为基底。
看来，在一个 n 维空间里，不是随随便便选取 n 个向量都能作为一组基底的，n 维空间中的基底必须满足这样的要求：n 维空间中任意一个向量都可以表示为基向量的线性组合，并且这种线性组合的表示方式必须是唯一的。那么，选择基底的正确姿势是什么？我们下面来仔细分析。

基底中的向量数量要足够

这句话听上去比较抽象，为了直观地进行讨论，我们先用三维空间进行举例，三维空间中的一组基，首先每一个基向量的维数必然为 3，而基向量的个数也必须为 3 个，如果数量不足，例如只有 2 个三维向量 e1、e2（假设它们不共线），那么无论对这 2 个向量如何进行线性组合，它们都只能表示二者所在平面上的向量，三维空间中该平面外的向量它们是无法表示的。

基向量满足线性无关

如何确保能够满足表示方法的唯一性呢？这里我们就引入向量线性无关的概念，一组向量需要满足线性无关的条件，即：其中任何一个向量都不能通过其余向量的线性组合的形式进行表示。
换句话说，当且仅当空间：从向量和基底谈起 - 图64 时，线性组合空间：从向量和基底谈起 - 图65 才能生成 0 向量，如果 xi中有非 0 值存在，那么这一组向量就是线性相关的了。
为什么一组向量满足了线性无关性的条件就等效于满足了线性组合表示方法的唯一性呢？我们用反证法来进行证明
证明过程：
有一组线性无关的向量空间：从向量和基底谈起 - 图66 ，对于空间中的向量 p，假设有两种不同的表示方法，即：空间：从向量和基底谈起 - 图67
整理为：
空间：从向量和基底谈起 - 图68
由于空间：从向量和基底谈起 - 图69 是线性无关的向量，那么则必须满足：
空间：从向量和基底谈起 - 图70
即：空间：从向量和基底谈起 - 图71 因此就不可能有两种线性组合的表达方式，从而产生了矛盾。通过反证法就证明了线性无关性和唯一性是等价的。
在这个三维空间中，我们就要求所选取的三个基向量线性无关，如果它们线性相关，那么 u3 就可以表示为 u1和 u2的线性组合，换句话说，候选的三个向量就处在一个平面上了，自然无法通过线性组合的方式表示三维空间中的所有向量，如图 8 所示：
空间：从向量和基底谈起 - 图72
这里我想补充说明一下，类似于图 8 中所展现的，3 个三维向量由于其线性相关，无法张成整个三维空间，只能张成三维空间中的二维平面甚至退化成一条直线，这种现象会经常遇到、用到，希望大家能够重视。
那么，如果三维空间中基向量的个数超过 3 了呢？当然也不行，假设有 4 个向量试图成为该空间中的一组基，我们任选出其中 3 个向量，按照前提，它们满足线性无关性，那么对于第 4 个向量，由于它处在三维空间中，它一定能够被前 3 个向量的线性组合所表示，那么三维空间中的这 4 个向量显然是线性相关的，无法满足向量构成基底的唯一性条件。因此，在三维空间中，3 个线性无关的向量就可以构成空间中的一组基底。

n 维空间不等价于 Rn 空间

这两个概念的比较其实很重要，在后面介绍空间的时候还会专门定义，我这里先简单说说。我就举 2 维空间的例子，2 维空间不仅仅只有 xoy 二维平面这一种情况，一个倾斜在 3 维空间中的过原点的平面依然能被称为 2 维空间。更高维的空间中同样也会包含 2 维空间。
我说这段话是什么意思呢？就是提醒读者，谈及 2 维空间的一组基，不要仅仅就觉得是两个线性无关的二维向量：空间：从向量和基底谈起 - 图73 。两个线性无关的三维向量: 空间：从向量和基底谈起 - 图74 ，甚至一般化为两个线性无关的 n 维向量都可以构成 2 维空间的一组基向量，只是各个 2 维空间的形态不同罢了。

结论

最后，我们在 n 维空间中再次回顾一般性的情况：一组向量空间：从向量和基底谈起 - 图75 能够构成 n 维空间的一组基底，就必须满足 n 维空间中的任何向量 v，都能表示成空间：从向量和基底谈起 - 图76 ,且这种表示方法是唯一的。
再换句话说，n 维空间中的基底由 n 个向量 ( 空间：从向量和基底谈起 - 图77 ) 构成，它们需要满足线性无关的条件。

张成空间

最后，我们来说一说张成（span）空间的概念，对于一组向量，它的所有线性组合所构成的空间就称之为这一组向量的张成空间。
简简单单的语言，但是内涵非常丰富，我们举几个实例来说明一下不同的几种情况。
情况一：
空间：从向量和基底谈起 - 图78
显然，向量 u1 和 u2 是两个线性无关的二维向量，它构成了二维空间 R2 的一组基，因此它的张成空间就是整个二维空间 R2。
情况二：
空间：从向量和基底谈起 - 图79
空间：从向量和基底谈起 - 图80 ，因此 u1 和 u2是线性相关的共线向量，它们张成的空间是一条穿过原点的一维直线。
情况三：
空间：从向量和基底谈起 - 图81
u1 和 u2 两个三维向量线性无关，但是由于向量的个数只有两个，因此它们的张成空间是三维空间中的一个穿过原点的平面。
情况四：
空间：从向量和基底谈起 - 图82
虽然向量的个数是 3，但是 u3=u1+2u2，因此它们是三个线性相关的共面向量，张成的空间仍然直是三维空间中的一个穿过原点的平面。
情况五：
空间：从向量和基底谈起 - 图83
u1、u2、u3 三个向量线性无关，构成三维空间 R3 中的一组基，因此它们的张成空间是整个三维空间 R3。

用平行的概念理解线性相关

我们回到初中平面几何的相关知识，可以发现线性相关的两个向量，在坐标系构成的空间中存在平行关系，因此我们可以借用平面几何中，两条直线是否平行来判断两个向量是否线性相关。
即：如果坐标系中的两个向量存在平行关系，那么我们就可以判断两个向量线性相关，拓展到三维空间则为，如果三维坐标系中有一个向量和由另外两个线性无关的向量张成的二维平面存在平行关系，那么我们就可以判断它们是三个线性相关的共面向量，例如情况四展示的那样。

总结

总结以上五种情况我们会发现：向量的个数和维数都不是其张成空间的决定因素，而是需要结合向量的线性无关性进行考量，这就会涉及到秩的相关概念，这一篇我们不再展开，后面的内容慢慢再谈。