对话系统(Dialogue Systems)是一个综合性问题,主要涉及自动语音识别 (automatic speech recognition,ASR)、自然语言理解 (natural language understanding, NLU)、对话状态跟踪 (dialog state tracking,DST)、自然语言生成 (natural language generation,NLG)和语音合成 (text to speech,TTS)五部分。对话系统作为NLP领域的核心研究课题,其中任务型对话系统在学界和工业界都有非常大的需求,也是当下的研究热点,与各种方法论紧密联系。现在其实有很多研究工作虽然都取名叫做自然语言理解,但是也是包含在对话系统这一范畴内的。

2021年南洋理工大学发表的论文: 《 Recent Advances in Deep Learning Based Dialogue Systems: A Systematic Survey 》
arXiv:2105.04387
第一章:简要介绍对话系统和深度学习。
第二章:讨论现代对话系统中流行的神经模型及其相关工作。
第三章:介绍面向任务对话系统的原理和相关工作,并讨论研究挑战和热门话题。
第四章:介绍开放域对话系统中的热门话题。
第五章:对话系统的主要评估方法。
第六章:常用的数据集
第七章:总结并提供有关研究趋势的一些见解


2018年 Hongshen Chen, Xiaorui Liu, Dawei Yin, Jiliang Tang,A Survey on Dialogue Systems: Recent Advances and New Frontiers
arXiv:1711.01731v1


2020年 计算机学报 华南理工大学软件学院 赵阳洋 王振宇 任务型对话系统研究综述


相关专有名词

Conversational AI 包含所有明指或暗指的对话交流
Dialogue system 专门指对话系统
Bot = Agent = 前缀+机器人
Task-oriented/Task-completed Bot
QA(Question Answering) bot
Chitchat/Social Chat/Chatbot
Open-domain chatbot - 开放领域机器人,什么都做,不区分领域
Domain chatbot - 特定领域场景下的机器人
Natural Language Understanding,NLP 自然语言理解
Automatic Speech Recognition,ASR 自动语音识别
Text To Speech,TTS 语音合成
Support Vector Machine,SVM支持向量机
Naive Bayesian 朴素贝叶斯
Convolution Neural Networks,CNN 卷积神经网络
LongShort-Team Memory,LSTM 长短期记忆网络

对话系统类型

对话系统可以根据应用场景的不同分为开放域(open-domain)问题和封闭域(closed-domain)问题2种类型.
Dialogue Systems - 图1

对话系统领域有很多研究方向,大的方面可以分为“面向任务型的对话系统”和“开放领域对话系统”、又比如“开放领域对话系统”又有专门研究带有感情、知识对话特色的系统等等,从模型方面考虑又有检索,生成甚至是检索+生成等。

任务型与聊天型

随着技术的不断发展,任务型对话系统在虚拟个人助理、智能家居、智能汽车(车载语音)等领域有了广泛应用。聊天型对话系统也在娱乐和情感陪护领域找到了应用场景。但我们应看到,这些传统对话系统存在着一些问题,如语义理解不准确造成答非所问,对话中展示的身份与个性不一致而难以获得用户信任,以及对话交互中可能存在的道德伦理风险等。

亟待解决

如何规避解决上述问题并开发交互效果更好的下一代对话系统逐渐成为了业内的热门研究课题。研究人员也基于各自不同的视角提出了对下一代对话系统的畅想。

相关学者

  • 清华大学 黄民烈:《下一代对话系统》有知识、有个性和有情感的下一代对话系统。
  • 西湖大学 张岳:《开放领域对话的挑战思索》,三个挑战,跨领域可拓展性、社会常识推理和逻辑推理。

    大厂怎么看

    2019苏州 CNCC 中国计算机大会 。 PS:中国计算机学会China Computer Federation,CCF
    image.png

  • 微软周明:面向深度理解的聊天机器人。 聊天机器人技术有从检索式回复到生成式回复再到集成式回复的三个发展阶段。努力的方向包括:让聊天机器人融入常识和知识、 精准理解对话历史、强化记忆机制从而提高上下文的一致性,并且能够实现定制回复生成的风格(包括词汇量、情感、句式和正规性等)

  • 阿里陈海青:阿里小蜜智能人机交互技术实践。面临的核心挑战是意图的平台化扩展效率和小样本场景的冷启动,就 NLU 的效率和效果而言,主要涉及的问题是如何构建数据、算法和服务。
  • 百度孙珂:可定制对话系统的挑战与设计
  • 小米王刚:语音交互带给人机交互的变化。认为未来的语音交互有三个发展趋势:无所不在、更自然的交互以及更懂你。而背后的技术可具体拆解为唤醒、识别、理解、满足与合成几大板块。
  • 京东何晓冬:任务导向型大规模对话系统及应用。虽然目前出现了很多应用于特定领域的对话系统并且领域内也在尝试针对开放领域以及高复杂、可靠性要求高的任务的对话系统,但是目前尚无系统能够真正通过图灵测试。(PS:图灵测试是指将机器与人混在一起进行交互,观察人类是否能发现交流者中存在机器,若人类不能发现,说明机器的交流与人类非常近似,则通过了图灵测试。)
  • 华为蒋欣:对话系统中的若干技术探索。作为构建对话系统的基石,对话数据的收集面临着不少困难,例如用户隐私、领域强相关、标注复杂性以及动态交互和评估等都是其面临的问题,对此学术界提出了人-人对话、人-机器对话以及机器-机器对话等三种数据收集方法。

2022年CNCC将在十月份于贵阳举办

对话模块框架

对话系统是一个综合性问题,主要涉及自动语音识别(automatic speech recognition,ASR)、自然语言理解(natural language understanding, NLU)、对话状态跟踪(dialog state tracking,DST)、自然语言生成(natural language generation,NLG)和语音合成(text to speech,TTS)五部分。
Dialogue Systems - 图3

相关开源资源

Gitee

GVP(Gitee最具价值开源项目)项目,最活跃的是深度学习相关项目;
对话系统有所欠缺,
image.png

或许与对话系统相关的项目

  1. wukong-robot 中文语音对话机器人/智能音箱项目,较活跃,近几个月有commit
  2. Senta 百度开源的情感分析系统 基于SKEP的情感预训练代码和中英情感预训练模型
  3. DDParser 百度开源的句法分析项目 基于深度学习平台飞桨和大规模标注数据研发的依存句法分析工具
  4. breadbot 还在实验阶段的新式聊天机器人框架
  5. yiwa 家庭数据展示和简单交互 家庭语音控制 主要针对于儿童群体,如:儿童自律表,幼儿园算数

    GitHub

  6. AnyQ 百度开源的问答系统框架 很久不更新了

  7. 对话机器人(聊天机器人)设计思考 只是一些早期(四年前)介绍文档,作者从事聊天机器人相关

    生活中的对话系统

  • 一些软件APP中,FAQ问答型,例如淘宝客服
  • 与一些硬件结合,语音+对话,如服务型机器人
  • 车载系统,对话机器人
  • 手机助手,以及推销电话,或者客服服务引导对话
  • 游戏npc对话场景中,从固定的对话脚本到鲜活的自由对话
  • 智能音箱,集成了对话机器人,播音乐,操纵智能家居,订机票打车等等一些任务