本书到目前为止一直都在使用命令式编程,它使用编程语句改变程序状态。考虑下面这段简单的命令式程序。

  1. def add(a, b):
  2. return a + b
  3. def fancy_func(a, b, c, d):
  4. e = add(a, b)
  5. f = add(c, d)
  6. g = add(e, f)
  7. return g
  8. fancy_func(1, 2, 3, 4) # 10

和我们预期的一样,在运行语句e = add(a, b)时,Python会做加法运算并将结果存储在变量e中,从而令程序的状态发生改变。类似地,后面的两条语句f = add(c, d)g = add(e, f)会依次做加法运算并存储变量。

虽然使用命令式编程很方便,但它的运行可能很慢。一方面,即使fancy_func函数中的add是被重复调用的函数,Python也会逐一执行这3条函数调用语句。另一方面,我们需要保存变量ef的值直到fancy_func中所有语句执行结束。这是因为在执行e = add(a, b)f = add(c, d)这2条语句之后我们并不知道变量ef是否会被程序的其他部分使用。

与命令式编程不同,符号式编程通常在计算流程完全定义好后才被执行。多个深度学习框架,如Theano和TensorFlow,都使用了符号式编程。通常,符号式编程的程序需要下面3个步骤:

  1. 定义计算流程;
  2. 把计算流程编译成可执行的程序;
  3. 给定输入,调用编译好的程序执行。

下面我们用符号式编程重新实现本节开头给出的命令式编程代码。

  1. def add_str():
  2. return '''
  3. def add(a, b):
  4. return a + b
  5. '''
  6. def fancy_func_str():
  7. return '''
  8. def fancy_func(a, b, c, d):
  9. e = add(a, b)
  10. f = add(c, d)
  11. g = add(e, f)
  12. return g
  13. '''
  14. def evoke_str():
  15. return add_str() + fancy_func_str() + '''
  16. print(fancy_func(1, 2, 3, 4))
  17. '''
  18. prog = evoke_str()
  19. print(prog)
  20. y = compile(prog, '', 'exec')
  21. exec(y)

输出:

  1. def add(a, b):
  2. return a + b
  3. def fancy_func(a, b, c, d):
  4. e = add(a, b)
  5. f = add(c, d)
  6. g = add(e, f)
  7. return g
  8. print(fancy_func(1, 2, 3, 4))
  9. 10

以上定义的3个函数都仅以字符串的形式返回计算流程。最后,我们通过compile函数编译完整的计算流程并运行。由于在编译时系统能够完整地获取整个程序,因此有更多空间优化计算。例如,编译的时候可以将程序改写成print((1 + 2) + (3 + 4)),甚至直接改写成print(10)。这样不仅减少了函数调用,还节省了内存。

对比这两种编程方式,我们可以看到以下两点。

  • 命令式编程更方便。当我们在Python里使用命令式编程时,大部分代码编写起来都很直观。同时,命令式编程更容易调试。这是因为我们可以很方便地获取并打印所有的中间变量值,或者使用Python的调试工具。

  • 符号式编程更高效并更容易移植。一方面,在编译的时候系统容易做更多优化;另一方面,符号式编程可以将程序变成一个与Python无关的格式,从而可以使程序在非Python环境下运行,以避开Python解释器的性能问题。

8.1.1 混合式编程取两者之长

大部分深度学习框架在命令式编程和符号式编程之间二选一。例如,Theano和受其启发的后来者TensorFlow使用了符号式编程,Chainer和它的追随者PyTorch使用了命令式编程,而Gluon则采用了混合式编程的方式

……

由于PyTorch仅仅采用了命令式编程,所以跳过本节剩余部分,感兴趣的可以去看原文