第十六章 类和函数

现在我们已经知道如何创建新类型了,下一步就要写一些函数了,这些函数用自定义类型做参数和返回值。在本章中还提供了一种函数式编程的模式,以及两种新的程序开发规划方式。

本章的样例代码可以在这里下载。然后练习题的样例代码可以在这里下载到。

16.1 时间

下面又是一个自定义类型的例子,这次咱们定义一个叫做 Time 的类,记录下当日的时间。

类的定义是如下这样:

  1. class Time:
  2. """Represents the time of day.
  3. attributes: hour, minute, second """

我们可以建立一个新的 Time 对象,然后对时分秒分别进行赋值:

  1. time = Time()
  2. time.hour = 11
  3. time.minute = 59
  4. time.second = 30

这个 Time 对象的状态图如图16.1所示。

下面做个练习,写一个名为print_time 的函数,接收一个 Time 对象,然后以时:分:秒的格式来输出。提示:格式序列’%.2d’就会用两位来输出一个整数,第一位可以为0。

写一个布尔函数,名为 is_after,接收两个 Time 对象,分别为 t1和 t2,然后如果 t1在时间上位于 t2的后面,就返回真,否则返回假。难度提高一下:不要用 if 语句,看你能搞定不。


Figure 16.1: Object diagram. Figure 16.1: Object diagram.


16.2 纯函数

后面的这些章节中,我们要写两个函数来对 time 进行加法操作。这两个函数展示了两种函数类型:纯函数和修改器。写这两个函数的过程中,也体现了我即将讲到的一种新的开发模式:原型和补丁模式,这种方法就是在处理复杂问题的时候,先从简单的原型开始,然后逐渐解决复杂的内容。

下面这段代码就是 add_time 函数的一个原型:

  1. def add_time(t1, t2):
  2. sum = Time()
  3. sum.hour = t1.hour + t2.hour
  4. sum.minute = t1.minute + t2.minute
  5. sum.second = t1.second + t2.second
  6. return sum

这个函数新建了一个新的 Time 对象,初始化了所有的值,然后返回了一个对新对象的引用。这种函数叫纯函数,因为这种函数并不修改传来做参数的对象,也没有什么效果,比如显示值啊或者让用户输入啊等等,而只是返回一个值而已。

下面就来测试一下这个函数,我将建立两个 Time 对象,start 包含了一个电影的开始时间,比如《巨蟒与圣杯》(译者注:1975年喜剧电影。Python的创造者Guido van Rossum特别喜欢这个喜剧团体:巨蟒飞行马戏团(Monty Python’s Flying Circus ),所以命名为 Python。),然后 duration(汉译就是持续时间)包含了该电影的时长,《巨蟒与圣杯》这部电影是一小时三十五分钟。add_time 函数就会算出电影结束的时间。

  1. >>> start = Time()
  2. >>> start.hour = 9
  3. >>> start.minute = 45
  4. >>> start.second = 0
  5. >>> duration = Time()
  6. >>> duration.hour = 1
  7. >>> duration.minute = 35
  8. >>> duration.second = 0
  9. >>> done = add_time(start, duration)
  10. >>> print_time(done)
  11. 10:80:00

很明显,10点80分00秒这样的时间肯定不是你想要的结果。问题就出在了函数不值得如何应对时分秒的六十位进位,所以超过60的时候没进位就这样了。所以我们得把超出六十秒的进位到分,超过六十分的进位到小时。

下面这个是改进版本:

  1. def add_time(t1, t2):
  2. sum = Time()
  3. sum.hour = t1.hour + t2.hour
  4. sum.minute = t1.minute + t2.minute
  5. sum.second = t1.second + t2.second
  6. if sum.second >= 60:
  7. sum.second -= 60
  8. sum.minute += 1
  9. if sum.minute >= 60:
  10. sum.minute -= 60
  11. sum.hour += 1
  12. return sum

这回函数正确工作了,但代码也开始变多了。稍后我们就能看到一个短一些的替代方案。

16.3 修改器

有时候需要对作为参数的对象进行一些修改。这时候这些修改就可以被调用者察觉。这样工作的函数就叫修改器了。

increment 函数,增加给定的秒数到一个 Time 对象,就可以被改写成一个修改器。

下面是个简单的版本:

  1. def increment(time, seconds):
  2. time.second += seconds
  3. if time.second >= 60:
  4. time.second -= 60
  5. time.minute += 1
  6. if time.minute >= 60:
  7. time.minute -= 60
  8. time.hour += 1

第一行代码进行了最简单的运算;后面的代码是用来应对我们之前讨论过的特例情况。

那么这个函数正确么?秒数超过六十会怎么样?

很明显,秒数超过六十的时候,就需要运行不只一次了;必须一直运行,之道 time.second 的值小于六十了才行。有一种办法就是把 if 语句换成 while 语句。这样就可以解决这个问题了,但效率不太高。

做个练习,写一个正确的 increment 函数,并且要不包含任何循环。

能用修改器实现的功能也都能用纯函数来实现。实际上有的编程语言只允许纯函数。有证据表明,与修改器相比,使用修改器能够更快地开发,而且不容易出错误。但修改器往往很方便好用,而函数式的程序一般效率要差一些。

总的来说,我还是建议你写纯函数,除非用修改器有特别显著的好处。这种模式也叫做函数式编程。

做个练习,写一个用纯函数实现的 increment,创建并返回一个新的 Time 对象,而不是修改参数。

16.4 原型与规划

这次我演示的开发规划就是『原型与补丁模式』。对每个函数,我都先谢了一个简单的原型,只进行基本的运算,然后测试一下,接下来逐步修补错误。

这种模式很有效率,尤其是在你对问题的理解不是很深入的时候。不过渐进式的修改也会产生过分复杂的代码——因为要应对很多特例情况,而且也不太靠靠——因为不好确定你是否找到了所有的错误。

另一种模式就是设计规划开发,这种情况下对问题的深入透彻的理解就让开发容易很多了。本节中的根本性认识就在于 TIme 对象实际上是一个三位的六十进制数字(参考 这里的解释。)!秒数也就是个位,分数也就是六十位,小时数就是三千六百位。

这样当我们写 add_time 和 increment 函数的时候,用60进制来进行计算就很有效率。

这一观察表明有另外一种方法来解决整个问题——我们可以把 Time 对象转换成整数,然后因为计算机最擅长整数运算,这样就有优势了。

下面这个函数就把 Times 转换成了整数:

  1. def time_to_int(time):
  2. minutes = time.hour * 60 + time.minute
  3. seconds = minutes * 60 + time.second
  4. return seconds

然后下面这个函数是反过来的,把整数转换成 Time(还记得 divmod 么,使用第一个数除以第二个数,返回的是除数和余数组成的元组。)

  1. def int_to_time(seconds):
  2. time = Time()
  3. minutes, time.second = divmod(seconds, 60)
  4. time.hour, time.minute = divmod(minutes, 60)
  5. return time

你最好先考虑好了,然后多进行几次测试运行,然后要确保这些函数都是正确的。比如你就可以试着用很多个 x 的值来运算time_to_int(int_to_time(x)) == x。这也是连贯性检测的一个例子。

一旦你确定这些函数都没问题,就可以用它们来重写一下 add_time 这个函数了:

  1. def add_time(t1, t2):
  2. seconds = time_to_int(t1) + time_to_int(t2)
  3. return int_to_time(seconds)

这个版本就比最开始那个版本短多了,也更容易去检验了。接下来就做个联系吧,用time_to_int 和 int_to_time 这两个函数来重写一下 increment。

在一定程度上,从六十进制到十进制的来回转换,远远比计算时间要麻烦的多。进制转换要更加抽象很多;我们处理时间计算的直觉要更好些。

然而,如果我们有足够的远见,把时间值当做六十进制的数值来对待,然后写出一些转换函数(比如 time_to_int 和 int_to_time),就能让程序变得更短,可读性更好,调试更容易,也更加可靠。

而且后续添加功能也更容易了。比如,假设要对两个时间对象进行相减来求二者之间的持续时间。简单版本的方法就是要用借位的减法。而使用转换函数的版本就更容易了,也更不容易出错。

有意思的事,有时候以困难模式来写一个程序(比如用更加泛化的模式),反而能让开发更简单(因为这样就减少了特例情况,也减少了出错误的概率了。)

16.5 调试

对于一个 Time 对象来说,只要分和秒的值在0-60的前闭后开区间(即可以为0但不可以为60),并且小时数为正数,就是格式正确的。小时和分钟都应该是整数,但秒是可以为小数的。

像这些要求也叫约束条件,因为通常都得满足这些条件才行。反过来说,如果这些条件没满足,就有可能是程序中某处存在错误了。

写一些检测约束条件的代码,能够帮助找出这些错误,并且找到导致错误的原因。例如,你亏写一个名字未 calid_time 的函数,接收一个 Time 对象,然后如果该对象不满足约束条件就返回 False:

  1. def valid_time(time):
  2. if time.hour < 0 or time.minute < 0 or time.second < 0:
  3. return False
  4. if time.minute >= 60 or time.second >= 60:
  5. return False
  6. return True

然后在每个自定义函数的开头部位,你就可以检测一下参数,来确保这些参数没有错误:

  1. def add_time(t1, t2):
  2. if not valid_time(t1) or not valid_time(t2):
  3. raise ValueError('invalid Time object in add_time')
  4. seconds = time_to_int(t1) + time_to_int(t2)
  5. return int_to_time(seconds)

或者你也可以用一个 assert 语句,这个语句也是检测给定的约束条件的,如果出现错误就会抛出一个异常:

  1. def add_time(t1, t2):
  2. assert valid_time(t1) and valid_time(t2)
  3. seconds = time_to_int(t1) + time_to_int(t2)
  4. return int_to_time(seconds)

assert 语句是很有用的,可以用来区分条件语句的用途,将 assert 这种用于检查错误的语句与常规的条件语句在代码上进行区分。

16.6 Glossary 术语列表

prototype and patch: A development plan that involves writing a rough draft of a program, testing, and correcting errors as they are found.

原型和补丁模式:一种开发模式,先写一个程序的草稿,然后测试,再改正发现的错误,这样逐步演化的开发模式。

designed development: A development plan that involves high-level insight into the problem and more planning than incremental development or prototype development.

设计规划开发:这种开发模式要求对所面对问题的高程度的深刻理解,相比渐进式开发和原型增补模式要更具有计划性。

pure function: A function that does not modify any of the objects it receives as arguments. Most pure functions are fruitful.

纯函数:不修改参数对象的函数。这种函数多数是有返回值的函数。

modifier: A function that changes one or more of the objects it receives as arguments. Most modifiers are void; that is, they return None.

修改器:修改参数对象的函数。大多数这样的函数都是无返回值的,也就是返回的都是 None。

functional programming style: A style of program design in which the majority of functions are pure.

函数式编程模式:一种程序设计模式,主要特征为大多数函数都是纯函数。

invariant: A condition that should always be true during the execution of a program.

约束条件:在程序运行过程中,应该一直为真的条件。

assert statement: A statement that check a condition and raises an exception if it fails.

assert 语句:一种检查错误的语句,检查一个条件,如果不满足就抛出异常。

16.7 练习

本章的例子可以在 这里下载;练习题的答案可以在这里下载。

练习1

写一个函数,名为mul_time,接收一个Time 对象和一个数值,返回一个二者相乘得到的新的Time 对象。

然后用 mul_time 这个函数写一个函数,接收一个 Time 对象,代表着一个比赛的结束时间,还有一个数值,代表比赛距离,然后返回一个表示了平均步调(单位距离花费的时间)的新的 Time 对象。

练习2

datetime 模块提供了一些 time 对象,和本章的 Time 对象很相似,但前者提供了更多的方法和运算符。读一读[这里的文档] Here吧。

  1. 用 datetime 模块来写一个函数,获取当前日期,然后输出今天是星期几。

2.写一个函数,要求输入生日,然后输出用户的年龄以及距离下一个生日的日、时、分、秒数。

3.有的两个人在不同日期出生,会在某一天,一个人的年龄是另外一个人年龄的两杯。这一天就叫做他们的双倍日。写一个函数,接收两个生日,然后计算双倍日。

  1. 再来点有挑战性的,写一个更通用的版本,来计算一下一个人的年龄为另外一个人年龄 n 倍时候的日期。

样例代码