51. 选择管道组件：任务简单性

51. 选择管道组件：任务简单性

除了数据可用性之外，在选择管道组件时还应考虑第二个因素：单个组件需要解决的任务有多简单？您应该尽可能尝试选择那些易于构建或学习的管道组件。那么，对于一个管道组件来说，何谓之「易于」学习呢？

思考下列的机器学习任务，并按照从难到易的顺序依次列出：

分类图像是否曝光过度（如上例所示）;
分类图像是室内还是室外拍摄；
分类图像是否包含猫；
分类图像是否包含黑色和白色毛皮的猫；
分类图像是否包含暹罗猫（特定品种的猫）。

上述任务每一个都是属于图像的二分类任务：输入图片，输出 0 或者 1。但是列表前面的知识似乎更容易让神经网络学习到。也即是说，用更少的样本训练更简单的任务。

到目前，机器学习还没有一个好的正式定义来定义是什么导致了一项任务变得容易或困难 [2]。但随着深度学习和多层神经网络的兴起，我们有时候会将那些只需要较少的计算步骤就能完成的任务定义为「容易」（对应于浅层神经网络）。而将那些需要更多的计算步骤才能完成的任务定义为「困难」（对应于深层神经网络）。但这都是非正式定义。

[2]：信息论中有一个概念叫做：「柯尔莫哥洛夫复杂性（Kolmogorov Complexity）」——学习函数的复杂性等价于可以产生该函数的最短计算机程序的长度。然而，这一理论概念在人工智能中几乎没有实际应用。详见：https：//en.wikipedia.org/wiki/Kolmogorov_complexity

如果您能够将一个复杂的任务，将其分解为更简单的子任务，那么通过显式地对子任务的步骤进行编码，你就给了算法先验知识，这可以帮助它更有效地学习一项任务。

51. 选择管道组件：任务简单性 - 图2