第 2 章算法

1. 算法定义
2. 算法的特性
3. 算法设计的要求
4. 算法效率的度量方法
- 1. 事后统计方法
- 2. 事前分析估算方法
5. 函数的渐进增长
- 例1
- 例2
- 例3
- 例4
6. 算法时间复杂度
7. 常见的时间复杂度
8. 最坏情况与平均情况
9. 算法空间复杂度
10. 总结

2022/02/26 晴17℃
2022/03/05多云21℃

1. 算法定义

算法是描述解决问题的方法。 如今普遍认可的对算法的定义是：算法是解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。

算法定义中，提到了指令，指令能被人或机器等计算装置执行。可以是计算机指令，也可以是平时的语言文字。为了解决某个或某类问题，需要把指令表示成一定的操作序列，操作序列包括一组操作，每一个操作都完成特定的功能，这就是算法。

2. 算法的特性

算法具有五个基本特性：输入、输出、有穷性、确定性和可行性。

1. 输入

算法具有零个或多个输入。(算法的输入可以是零个)

2. 输出

算法至少有一个或多个输出。(算法是一定要输出的，可以是打印输出，也可以是返回一个或多个值)

3. 有穷性

指算法在执行有限的步骤之后，自动结束而不会出现无限循环，并且每一个步骤在可接受的时间内完成。(死循环不满足有穷性)
这里有穷的概念并不是纯数字意义的，而是在实际应用当中合理的、可以接受的“有边界”。

4. 确定性

算法的**每一步骤都具有确定的含义，不会出现二义性。

**算法在一定条件下，只有一条执行路径，相同的输入只能有唯一的输出结果。算法的每个步骤被精确定义而无歧义。

5. 可行性

算法的每一步都必须是可行的，也就是说，**每一步都能够通过执行有限次数完成。

**可行性意味着算法可以转换为程序上机运行，并得到正确的结果。

尽管在目前计算机界也存在那种没有实现的极为复杂的算法，不是说理论上不能实现，而是因为过于复杂，当前的编程方法、工具和大脑限制了这个工作，不过这都是理论研究领域的问题，不属于现在要考虑的范围。

3. 算法设计的要求

1. 正确性

算法至少应该具有输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案。

但是算法的“正确”通常在用法上有很大的差别，大体分为以下四个层次。

算法程序没有语法错误。(要求最低)

算法程序对于合法的输入数据能够产生满足要求的输出结果。

算法程序对于非法的输入数据能够得出满足规格说明的结果。(作为一个算法是否正确的标准)

算法程序对于精心选择的，甚至刁难的测试数据都有满足要求的输出结果。(最困难的)

算法的正确性在大部分情况下都不可能用程序来证明，而是用数学方法证明的。、证明一个复杂算法在所有层次上都是正确的，代价非常昂贵。

2. 可读性

算法设计的另一目的是为了便于阅读、理解和交流。 可读性高有助于理解算法，晦涩难懂的算法往往隐含错误，不易被发现，并且难与调试和修改。
写代码的目的，一方面是为了让计算机执行，但还有一个重要的目的是为了便于他人阅读，让人理解和交流，自己将来也可能阅读，如果可读性不好，时间长了自己都不知道写了些什么。 可读性是算法(也包括实现它的代码)好坏很重要的标志。

3. 健壮性

一个好的算法还应该能对输入数据不合法的情况做合适的处理。
当输入数据不合法时，算法也能做出相关处理，而不是产生异常或莫名其妙的结果。

4. 时间效率高和存储量低

时间效率指的是算法的执行时间，对于同一个问题，如果有多个算法能够解决，执行时间短的算法效率高，执行时间长的效率低。
存储量需求指的是算法在执行过程中需要的最大存储空间，主要指算法程序运行时所占用的内存或外部硬盘存储空间。

设计算法应该尽量满足时间效率高和存储量低的需求

综上，好的算法，应该具有正确性、可读性、健壮性、高效率和低存储量的特征。

4. 算法效率的度量方法

效率大都指算法的执行时间。
如何度量一个算法的执行时间呢？
通过对算法的数据测试，利用计算机的计时功能，来计算不同算法的效率是高还是低。

1. 事后统计方法

这种方法主要是通过设计好的测试程序和数据，利用计算机计时器对不同算法编制的程序的运行时间进行比较，从而确定算法效率的高低。

缺陷：

必须依据算法事先编制好程序，这通常需要花费大量的时间和精力。
时间的比较依赖计算机硬件和软件等环境因素，有时会掩盖算法本身的优劣。
算法的测试数据设计困难，并且程序的运行时间往往还与测试数据的规模有很大关系，效率高的算法在小的测试数据面前往往得不到体现。

基于事后统计方法有这样那样的缺陷，我们考虑不予采纳。

2. 事前分析估算方法

在计算机程序编制前，依据统计方法对算法进行估算。

经过分析，我们发现，一个用高级程序语言编写的程序在计算机上运行时所消耗的时间取决于下列因素：

算法采用的策略、方法(算法好坏的根本)
编译产生的代码质量。(要由软件来支持)
问题的输入规模。✔
机器执行指令的速度。(硬件性能)

也就是说，抛开这些与计算机硬件、软件有关的因素，一个程序的运行时间，依赖于算法的好坏和问题的输入规模(输入量的多少)。

💡例子：两种求和的算法：

第一种算法：执行了1 + (n + 1) + n + 1次 = 2n + 3次
第二种算法：执行了1 + 1 + 1 = 3次

事实上两个算法的第一条和最后一条语句是一样的，所以我们关注的代码其实是中间的那部分，把循环看作一个整体，忽略头尾循环判断的开销，那么这两个算法其实就是**n**次与**1**次的差距。算法好坏显而易见。

💡再来延伸一下上面这个例子：

这个算法当中，循环部分的代码整体需要执行**n****2****(忽略循环体头尾的开销)**次。显然这个算法的执行次数对于同样的输入规模n = 100，要多于前面两种算法，这个算法的执行时间随着n的增加也将远远多于前面两个。

测定运行时间最可靠的方法：计算对运行时间有消耗的基本操作的执行次数。运行时间与这个计数成正比。

不关心编写程序所用的程序设计语言是什么，也不关心这些程序将跑在什么样的计算机中，只关心它所实现的算法。这样，不计那些循环索引的递增和循环终止条件、变量声明、打印结果等操作，最终，在分析程序的运行时间时，最重要的是把程序看成是独立于程序设计语言的算法或一系列步骤。

在分析一个算法的运行时间时，重要的是把基本操作的数量与输入规模关联起来，即基本操作的数量必须表示成输入规模的函数。

随着**n**的值越来越大，它们在时间效率上的差异也就越来越大。

5. 函数的渐进增长

例1

假设现在有两个算法A和B，它们的输入规模都是n，算法A要做2n + 3次操作，你可以理解为先有一个n次的循环，执行完成后，再有一个n次循环，最后有三次赋值或运算，共2n + 3次操作。算法B要做3n + 1次操作。哪个算法更快呢？

准确说来，答案是不一定的

当n = 1时，算法A效率不如算法B(次数比算法B要多一次)
当n = 2时，两者效率相同
当n > 2时，算法A就开始优于算法B了，随着n的增加，算法A比算法B越来越好了(执行的次数比B要少)

结论：算法A总体上要好过算法B。

输入规模**n**在没有限制的情况下，只要超过一个数值**N**，这个函数就总是大于另一个函数，称函数是渐进增长的。

函数的渐进增长：给定两个函数**f(n)**和**g(n)**，如果存在一个整数**N**，使得对于所有的**n > N**，**f(n)**总是比**g(n)**大，那么，**f(n)**的增长渐近快与**g(n)**。

随着n的增大，后面的+ 3还是+ 1其实都不影响最终的算法变化的，例如算法A’与算法B’，所以，我们可以忽略这些加法常数。

例2

算法C是4n + 8，算法D是2n2+1。

当n ≤ 3时，算法C要差于算法D(因为算法C次数比较多)
当n > 3时，算法C的优势就越来越优于算法D了，到后来更是远远胜过。

而当后面的常数去掉后，结果没有发生改变。甚至再观察发现，哪怕去掉与n相乘的常数，这样的结果也没发生改变，算法C’的次数随着n的增长，还是远小于算法D'。也就是说，与最高次项相乘的常数并不重要。

例3

算法E是2n2 + 3n + 1，算法F是2n3 + 3n + 1。

当n = 1时，算法E和算法F结果相同
当n > 1时，算法E的优势就要开始优于算法F

随着n的增长，差异非常明显。通过观察发现，最高次项的指数大的，函数随着**n**的增长，结果也会变得增长特别快。

例4

算法G是2n2，算法H是3n + 1，算法I是2n2 + 3n + 1

当n的值越来越大时，你会发现，3n + 1已经没法和2n2的结果相比较，最终几乎可以忽略不计。也就是说，随着n的值变得非常大以后，算法G其实已经很趋近与算法I。

于是可以得出结论：判断一个算法的效率时，函数中的常数和其他次要项常常可以忽略，而更应该关注主项(最高阶项)的阶数。

判断一个算法好不好，只通过少量的数据是不能做出准确判断的。根据刚才的几个样例，发现如果可以对比这几个算法的关键执行次数函数的渐进增长性，基本就可以分析出：某个算法，随着**n**的增大，它会越来越优于另一个算法，或者越来越差于另一算法。这其实就是事前估算方法的理论依据，通过算法时间复杂度来估算算法时间效率。

6. 算法时间复杂度

1. 定义

在进行算法分析时，语句总的执行次数T(n)是关于问题规模n的函数，进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度，也就是算法的时间量度，记作：**T(n) = O(f(n))**。它表示随问题规模**n**的增大，算法执行时间的增长率和**f(n)**的增长率相同，称作算法的渐近时间复杂度，简称为时间复杂度。其中f(n)是问题规模n的某个函数。

这样用大写O()来体现算法时间复杂度的记法，称为大O记法。

一般情况下，随着**n**的增大，**T(n)**增长最慢的算法为最优算法。

显然，由此算法时间复杂度的定义可知，三个求和算法的时间复杂度分别为O(n),O(1),O(n2)。还给它们取了非官方的名称，

常数阶：**O(1)**
线性阶：**O(n)**
平方阶：**O(n****2****)**

2. 推导大O阶方法🎈(重点)

用常数1取代运行时间中的所有加法常数。
在修改后的运行次数函数中，只保留最高阶项。
如果最高阶项存在且不是1，则去除与这个项相乘的常数。得到的结果就是大O阶。

3. 常数阶

首先顺序结构的时间复杂度。下面这个就是高斯算法。

根据大O阶的方法，第一步就是把常数项3改为1。在保留最高阶项时发现，它根本没有最高阶项。

时间复杂度：O(1)

试想一下，如果这个算法当中的语句sum = (1 + n) * n / 2有10句，即：

事实上无论n为多少，上面的两段代码就是3和12次执行的差异。 这种与问题的大小无关(n的多少)，执行时间恒定的算法，称之为具有**O(1)**的时间复杂度，又叫常数阶。

注意：不管这个常数是多少，都记作O(1)，而不能是O(3)、O(12)等其他任何数字。
对于分支结构而言，无论是真，还是假，执行的次数都是恒定的，不会随着**n**的变大而发生变化，所以单纯的分支结构(不包含在循环结构中)，其时间复杂度也是**O(1)**。

4. 线性阶

线性阶的循环结构会复杂很多。要确定某个算法的阶次，常常需要确定某个特定语句或某个语句集运行的次数。

因此，要分析算法的复杂度，关键就是要分析循环结构的运行情况。

时间复杂度：O(n)

5. 对数阶

由于每次count乘以2之后，就距离n更近了一分。也就是说，有多少个2相乘后大于n，则会退出循环。由2x = n得到x = log2n。

时间复杂度：O(logn)

6. 平方阶

内循环时间复杂度：O(n)
整个代码的时间复杂度：O(n2)

7. 循环嵌套

如果外循环的循环次数改为了m，时间复杂度就变为O(m × n)

循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。

下面这个循环嵌套，它的时间复杂度是多少呢？

当i = 0时，内循环执行了n次
当i = 1时，内循环执行了n - 1次
……
当i = n - 1时，内循环执行了1次

总的执行次数为：n + (n - 1) + (n - 2) + ... + 1 = n (n + 1) / 2 = n2 / 2 + n / 2

第一条，没有加法常数不予考虑；第二条，只保留最高阶项，因此保留n2 / 2；第三条，去除这个项相乘的常数，也就是去除 1 / 2，最终这段代码的时间复杂度为O(n2)。

时间复杂度：O(n2)

理解大O推导不算难，难的是对数列的一些相关运算，这更多的是考察你的数学知识和能力

8. 方法调用

function函数的时间复杂度：O(1)。
整体的时间复杂度：O(n)。

假如function是下面这样的

时间复杂度：O(n2)

下面这段相对复杂的语句

执行次数：f(n) = 1 + n + n2 + n(n + 1) / 2 = 3 / 2 n2 + 3 / 2 n + 1

时间复杂度：O(n2)

7. 常见的时间复杂度

常用的时间复杂度所耗费的时间从小到大依次是：
**O(1) < O(logn) < O(n) < O(nlogn) < O(n****2****) < O(n****3****) < O(2****n****) < O(n!) <O(n****n****)**

8. 最坏情况与平均情况

最坏情况运行时间是一种保证，那就是运行时间将不会再坏了。在应用中，这是一种最重要的需求，通常，除非特别指定，我们提到的运行时间都是最坏情况的运行时间。而平均运行时间也就是从概率的角度看，这个数字在每一个位置的可能性是相同的，所以平均的查找时间为n / 2次后发现这个目标元素。 平均运行时间是所有情况中最有意义的，因为它是期望的运行时间。 对算法的分析，一种方法是计算所有情况的平均值，这种时间复杂度的计算方法称为平均时间复杂度。另一种方法是计算最坏情况下的时间复杂度，这种方法称为最坏时间复杂度。一般在没有特殊说明的情况下，都是指最坏时间复杂度

9. 算法空间复杂度

算法的空间复杂度通过计算算法所需的存储空间实现，算法空间复杂度的计算公式记作：S(n) = O(f(n)),其中，n为问题的规模，f(n)为语句关于n所占存储空间的函数。
一般情况下，一个程序在机器上执行时，除了需要存储程序性本身的指令、常数、变量和输入数据外，还需要存储对数据操作的存储单元。若输入数据所占空间只取决于问题本身，和算法无关，这样只需要分析该算法在实现时所需的辅助单元即可。 若算法执行时所需的辅助空间相对于输入数据量而言是个常数，则称此算法为原地工作，空间复杂度为**O(1)**。

通常，我们都使用“时间复杂度”来指运行时间的需求，使用“空间复杂度”指空间需求。当不用限定词地使用“复杂度”时，通常都是指时间复杂度。

10. 总结

算法的定义
算法的特性
算法的设计的要求
算法特性与算法设计容易混，需要对比记忆
算法的度量方法：事后统计方法(不科学、不准确)、事前分析估算方法
函数的渐近增长
推导大O阶
时间复杂度所耗时间的大小排序
算法最坏情况和平均情况的概念，以及空间复杂度的概念

第 2 章 算法

1. 算法定义

2. 算法的特性

1. 输入

2. 输出

3. 有穷性

4. 确定性

5. 可行性

3. 算法设计的要求

1. 正确性

2. 可读性

3. 健壮性

4. 时间效率高和存储量低

4. 算法效率的度量方法

1. 事后统计方法

2. 事前分析估算方法

5. 函数的渐进增长

例1

例2

例3

例4

6. 算法时间复杂度

1. 定义

2. 推导大O阶方法🎈(重点)

3. 常数阶

4. 线性阶

5. 对数阶

6. 平方阶

7. 循环嵌套

8. 方法调用

7. 常见的时间复杂度

8. 最坏情况与平均情况

9. 算法空间复杂度

10. 总结