概述
人工智能按研究学派主要分为三类:
行为主义(Behaviorism)
符号主义(Symbolism)
连接主义(Connectionism)
连接主义是当前业界关注的焦点
行为主义
行为主义的核心思想是基于控制论构建感知动作型控制系统。
1943年,ARosenblueth,J. Bigelow,N. Wiener提出所有有目的的行为都需要负反馈。
Rosenblueth, A., Wiener, N., & Bigelow, J. (1943). Behavior, Purpose and Teleology. Philosophy of Science, 10, 18 - 24.
1948 年,N. Wiener 在《控制论》中提出控制论是研究动物和机器的控制与通信的科学,并讨论了用机器实现国际象棋的可能性。
同时期的 W. Ashby 也探讨过人工智能机器的可能性,并在《大脑设计》中阐述了利用包含适当反馈环路获取稳定适应行为的自平衡设备来创造智能。
通过控制论实现人工智能的可能性,在 20 世纪 50 年代引起人工智能研究者的关注。
在 C. Shannon 和 J. McCarthy 征集出版的《自动机研究》中有很多控制论方面的研究工作,涉及有限自动机、图灵机、合成自动机,希望基于控制论去构建一些感知动作的反应性的控制系统。
从比较直观的角度看,行为主义方法可以模拟出类似于小脑这样的人工智能,通过反馈来实现机器人的行走、抓取、平衡,因此有很大的实用价值。
符号主义
符号主义是基于符号逻辑的方法,用逻辑表示知识和求解问题。
其基本思想是:用一种逻辑把各种知识都表示出来;当求解一个问题时,就将该问题转变为一个逻辑表达式,然后用已有知识的逻辑表达式的库进行推理来解决该问题。
在各种符号逻辑中,最常见或许也是最简单的是命题逻辑 (propositional logic)。
在具体演算过程中,命题逻辑只需要考虑与、或、非三种操作,以及0、1两种变量取值。
符号主义是达特茅斯会议上最受关注的方法。当时普遍认为符号主义是通向强人工智能的一条终极道路。
但通过60多年的探索,符号主义展现出一些本质性的问题:
(1) 逻辑问题。从逻辑的角度,难以找到一种简洁的符号逻辑体系,能表述出世间所有的知识。
(2) 常识问题。人类在做判断决策时,往往基于大量的常识。而世间的常识数不胜数。
(3) 求解器问题。在符号主义中,解决问题的关键环节是逻辑求解器。它负责根据已的知识来判断一个新的问题是否成立。但是,逻辑求解器的时间复杂度实在是太高了。即便是最简单的命题逻辑,它的求解也依然是 NP 完全的。
由于上述原因,符号主义在工业上实用的成功案例很少。如果从 JCAI (国际人工智能联合会议) 收录的论文数量看,现在在整个人工智能学术界,研究符号主义的学者的数量远少于10%。
符号主义最本质的问题是只考虑了理性认识的智能。
而人类的智能包括感性认识(感知)和理性认识(认知)两个方面。
即便人类自己,也是一步步从底层的感知智能开始,和动物样识别各种物体、 气味、声音,产生本能反应,然后才在此基础上产生了生物界中独一无二的复杂语言, 进而文字,再进而数学和逻辑,最终形成认知智能。
符号主义跳过前面这些阶段,直奔逻辑,难免遇到巨大的阻碍。
在未来通往强人工智能的道路上,符号主义方法会和其他方法融合,发挥重要作用。
连接主义
人类大脑是我们迄今已知最具智能的物体。
它基于近千亿个神经元细胞连接组成的网络,赋予人类思考的能力。
连接主义方法的基本出发点是借鉴大脑中神经元细胞连接的计算模型,用人工神经网络来拟合智能行为。
事实上,连接主义方法并不是完全照抄人类的大脑,因为生物的大脑非常复杂,即便是一个神经元细胞,也很复杂。
如图所示,一个神经元细胞包括细胞体和突起两部分,其中细胞体由细胞膜、细胞核、细胞质组成,突起有轴突(axon) 和树突 (dendrity) 两种。
轴突是神经元长出的一个长而且分支少的突起,树突是神经元长出的很多短而且公支多的突起。
一个神经元的轴突和另外一个神经元的树突相接触,形成突触。
人工神经网络则对生物的神经元细胞网络进行了大幅度的抽象简化,把每个细胞体的输出、每个突触强度都抽象成了一个数字。
具体来说,图中的一个人工神经元可以从外界得到输入,每个输入有一个突触的权重,对神经元的输入进行加权汇总之后,通过一个非线性函数得到该神经元的输出。
连接主义方法肇始于 1943 年。心理学家 w. McCulloch 和数理逻辑学家 W. Pitts 通过模拟人类神经元细胞结构,建立了 M-P 神经元模型(MCulloch Pitts neuron mode),这是最早的人工神经网络。
此后60余年里,通过 F. Rosenblatt (感知机模型)、D. Rumelhart (反向传播训练方法)、Y. LeCun (卷积神经网络)、Y. Bengio (深度学习)、G.Hinton (深度学习和反向传播训练方法)等学者的不懈努力,连接主义逐渐成为整个人工智能领城的主流研究方向。
目前,深度学习等方法已广泛应用于图像识别、语音识别、自然语言处理等领城,产生了换头换脸、图像风格迁移等有意思的应用,甚至在围棋和《星际争霸》游戏中战胜了人类顶尖高手。
目前围绕深度学习技术,已经逐渐形成了万亿级别的智能产业,包括智能安防、智能教育、智能手机、智能家电、智慧医疗、智慧城市、智慧工厂等。
但是需要认识到深度学习不一定是通向强人工智能的最终道路,已知的局限包括:
(1)泛化能力有限。深度学习训练需要依靠大量的样本,与人类的学习机理不同。 人关在幼儿时期会依据大量外在数据学习,但是成年人类的迁移学习能力和泛化能力远高于现在的探度学习。
(2)缺乏推理能力。缺乏推理能力使得深度学习不擅长解决认知类的问题。如何将擅大推理的符号逻辑与深度学习结合起来,是未来非常有潜力的发展方向。
(3)缺乏可解释性。在比较重视安全的领域,缺乏可解释性会带来一些问题。比如,某个决策是如何做出来的?深度学习为什么识别错了?
(4)鲁棒性欠佳。在一 张图像上加一些人眼很难注意到的点,就可以让深度学习算送产生错误判断,例如把猪识别成猫,把牛识别成狗。