人机对话原理

1.语音交互构成

语音识别ASR、自然语言处理NLP、语音合成TTS

2.NLP关键技术

1)分词
2)语法
3)语义分析
4)篇章分析

3.人机对话实现技术

1)IF表达式
2)词汇分类
3)语义组块分析
4)统计解析过程
5)组块解释方法
6)IF生成

设计原则

1)提供功能选项
2)路径节点指引
3)意图示例
4)信息量限制
5)利用视觉反馈

设计流程

1.定义

1)产品定位
2)需求场景
3)功能基本规则
4)用户角色
5)语音角色Persona

2.对话设计

1)尝试对话,收集意图和槽位
2)编写剧本
1.对话逻辑和流程
2.语法:NLP输入句式
3.应答:用户语音输出脚本
4.场景补全和互连
5.修复设计
3)剧本测试
1.角色扮演测试
2.收集问题并调整

——-(若为语音单通道交互产品,省去以下步骤)——-

3.界面设计

1)视觉化状态与反馈
2)语音视觉形象
3)ASR语音识别显示

4.原型测试

1)对话+界面角色扮演
2)收集问题并调整
3)语音设计检查表

5.设计输出

6.语音数据

1)收集与跟踪
2)调整迭代

Keynote删减记录

NLP:
汉字文本组成:字(符)、词、词组、句子、段、节、章、篇
在组合和层级变化时,都会产生歧义,影响正常语言交流
消除歧义:语法、上下文、语境和背景知识

关键技术1:分词
词是对话最小单元,理解句子的前提是明确句子里用到哪些词
例:余杭金融城咖啡馆在哪里
正确:余杭/金融城/咖啡馆/在/哪里
错误:余杭/金融/城/咖啡/馆/在/哪里

关键技术2:语法分析
在分词的基础上,计算机需要了解词与词之间的连接规则、功能和关系,也就是语法
语法成分:主谓定状补等
语法内容:词类,指名词、动词、形容词、代词、副词等

关键技术3:语义分析
目标:语义角色标注和消除歧义
语义角色标注:以句子的谓词为中心,研究句子中各成分与谓词之间的关系,并且用语义角色来描述他们的关系。
例:胡迪昨晚在西湖边接受了采访
消除歧义:以句子的谓词为中心,研究句子中各成分与谓词之间的关系,并且用语义角色来描述他们的关系。
例:
“对不起,我去方便一下”
“你要是方便的话,我请你吃个饭”

关键技术4:篇章分析
目标:在多轮对话时,分析篇章结构,正确理解上下文
例:
“帮我定一个5分钟的倒计时”
2秒钟后…
“Hmmm…再定一个40秒的”