from 自然语言处理实践:聊天机器人技术原理与应用

https://www.zhihu.com/pub/book/119621319

1950 年的图灵

对聊天机器人的研究可以追溯到 1950 年图灵(Alan M.Turing)在 Mind 期刊上发表的文章 Computing Machinery and Intelligence,这篇文章开篇就提出了「机器能思考吗?(Can machines think?)」的设问,然后提出通过让机器参与模仿游戏(Imitation Game)来验证「机器」能否进行「思考」,进而提出了经典的图灵测试(Turing Test)。通过图灵测试被认为是人工智能研究的终极目标[1],图灵本人也因而被称为「人工智能之父」。

模仿人类

已知的发布最早的聊天机器人程序 ELIZA[1]诞生于 1966 年,由麻省理工学院(MIT)的约瑟夫·魏泽鲍姆(Joseph Weizenbaum)开发。魏泽鲍姆是自然语言处理方面的先驱,他开发的 ELIZA 被看作可以用于临床模拟罗杰斯心理治疗的 BASIC 脚本程序。

值得注意的是,尽管 ELIZA 的实现技术仅为对用户输入计算机的话语做关键词匹配,并且其回复规则是由人工编写的(魏泽鲍姆的本意只是让 ELIZA 模仿人类的交谈),但用户与 ELIZA 交谈时却如同自己面对着心理治疗师,开始向 ELIZA 倾诉自己内心深处的想法。随后,魏泽鲍姆撰写了 Computer Power and Human Reason 一书,以表达他对人工智能技术的看法。不论怎样,ELIZA 对自然语言处理和人工智能的研究与发展产生了重大影响,全球各地的研究机构也由此开始了对聊天机器人的相关研究。

有态度的模仿人类

1972 年,美国精神病学家肯尼思·科尔比(Kenneth Colby)在斯坦福大学(Stanford University)使用 LISP 编写了模拟偏执型精神分裂症表现的计算机程序 PARRY。由于 PARRY 体现的会话策略比魏泽鲍姆的 ELIZA 更严谨更先进,PARRY 被描述为「有态度的 ELIZA」。

研究人员在 20 世纪 70 年代早期,使用图灵测试的变体对 PARRY 进行了测试,测试由一组经验丰富的精神科医生参与,这些参与测试的精神科医生通过电传打印机分别与患者和运行 PARRY 的计算机进行对话,并将这些对话记录展示给另一组(33 名)精神科医生。这两组精神科医生分别被要求确定哪些对话是人类患者产生的,哪些是计算机程序产生的。测试结果表明,参与测试的两组精神科医生中只有 48% 在规定时间内做出了正确的判断,正确率约等于随机投票产生的正确率。

互动聊天机器人

1988 年,英国程序员罗洛·卡彭特(Rollo Carpenter)创建了聊天机器人 Jabberwacky。Jabberwacky 项目的目标是「以有趣、娱乐和幽默的方式模拟自然的人际聊天」,这个项目也是通过与人类互动创造人工智能聊天机器人的早期尝试,但 Jabberwacky 并未被用于执行任何其他功能。

Jabberwacky 项目于 1997 年正式上线,上线后它会存储所有用户与自己的对话,并且在与用户的对话过程中使用上下文模式匹配技术找到最合适的回复内容。

Jabberwacky 并没有硬编码的规则,它完全依赖于反馈的原则,这一点与大多数基于规则约束的聊天机器人非常不同。

也是在 1988 年,加州大学伯克利分校(UC Berkeley)的罗伯特·威林斯基(Robert Wilensky)等人开发了名为 UC(UNIX Consultant)的聊天机器人系统。顾名思义,UC 聊天机器人的目的是帮助用户学习使用 UNIX 操作系统。UC 聊天机器人以英文回复用户,它具备分析用户输入、确定用户需求、给出解决用户需求的规划、决定与用户沟通的内容、根据用户对 UNIX 系统的熟悉程度进行建模等功能。如果说 ELIZA 开启了智能聊天机器人的研究,那么 UC 则真正提高了聊天机器人的智能化程度。

勒布纳奖

1990 年,美国科学家兼慈善家休·勒布纳(Hugh G.Loebner)设立了人工智能年度比赛——勒布纳奖(Loebner Prize)。勒布纳奖旨在借助交谈测试机器的思考能力,它被看作对图灵测试的一种实践,其比赛的奖项分为金、银、铜三等。根据勒布纳奖的规定,如果参与比赛的程序不仅能通过以文本方式进行的交谈测试,还能在音频和视频测试中过关,则获金奖,赢得 10 万美元和一枚 18K 黄金制金牌,同时勒布纳奖的年度比赛将会中止;如果程序能在以文本方式进行的交谈测试中长时间迷惑住至少半数裁判,则获银奖;如果程序未达到以上标准,则在测试中迷惑住最多裁判的程序赢得 2000 美元和一枚铜奖。从 1991 年首届比赛开办,至《自然语言处理实践》撰写时,尚无参赛程序达到金奖或者银奖标准。