关键内容:机器人、知识图谱、SaaS

作者:小步 篇幅:全文约 5245字 阅读时长:约10分钟 提示:以下内容仅为个人分享,有兴趣交流的伙伴可在下方讨论区留言。

知识库首页

产品API:进阶全栈PM手册

提示:上方链接属于全手册首页,伙伴们打开后可以关注或收藏,用于日常工作查看,其中关注后,可以实时收到文档更新通知,希望对你有所帮助。

前言

随着AI技术的不断成熟和进步,更多玩家开始进行细分领域的探索和商业应用,智能客服机器人便是一个典型的商业应用场景,涉及几个核心概念:自然语言处理(NLP)、机器学习、知识图谱、知识库。

本文主要针对智能客服机器人进行结构性的产品分析,同时也应用了一套拆解一个新领域的思考框架,通过此系列的了解,能够帮助你快速熟悉某一类产品的状态,希望能够有所帮助。

这是个什么产品?

产品定义(一句话描述)

智能客服机器人,是一款采用NLP技术降低人工客服沟通成本,提高客服效率的工具型产品

产品目标

让服务输入更便捷,让服务输出更精准高效。凡是涉及到对话沟通中的每一个环节,都可以围绕即机器人的优化去提高效率

产品逻辑(底层核心是什么)

智能客服机器人底层本质为对话系统,即:用户输入-语义识别-对话管理-应答-机器人输出。

其中,每一次用户的询问和问答,即输入通过NLP进行语义理解后,与知识库内容进行匹配,从而做相关的应答的回复,所有的核心出发点,则来源于核心知识库的构建。

知识库便是机器人应答响应的数据源,目的就是让机器人知道不同问题该回答什么。且需要借助机器学习进行不断训练,让机器人识别更多的问题,不断提高回答的准确性,最终可应对海量问题咨询,实现无人工干预的QA场景。

因此,利用此产品逻辑,即可帮助降低人工客服参与,极大程度提高效率。

产品分类

按对话类型分类:问答型、任务型、闲聊型,其中问答类和任务型是智能客服机器人的主要应用类型,基本特点介绍如下

1.问答型

问答类机器人,根据复杂度由低到高,又分为三类:检索型机器人FAQ-Bot、多轮对话的信息咨询型机器人、知识图谱型机器人KG-Bot

检索型机器人FAQ-Bot

主要适用于解答非用户个性化的问题,返回的是静态知识,无需调用接口返回答案,一般为一轮问答对话便是一次完成解决流程。

核心流程:
🐥 智能客服机器人产品分析 - 图1
(1)用户问题到本体识别
此部分主要为知识库的设计结果,知识库的的结构层级包含类目和词条实体,即定义问题核心问答关键字。
如下方案例:
问:我的生日是什么时间?
答:你的生日是2020年1月1日
“生日”为本体识别的关键字,通过词条信息维护:同义词、关联问题、相似问题、分类等方式,便可完成基本本体识别,而这一部分就是初始化知识库的基本语料添加和维护的结果

语料的添加和维护包含两个情况:
冷启动:初期依靠人工添加和NLP手段的扩充语料
迭代:人工标注迭代

基于此,大家可以感知的大部分的智能应用产品,都需要前期的人工标注完成初始化。

(2)语义相似度计算
此部分便是自然处理语言NLP发挥作用的核心环节,便是对问题本身含义的解析,而这里相似度准确度的高低,便取决于机器学习中的两个概念的应用:

无监督学习:
非监督学习,也就是没有“人”在旁边督促你学习,没有人为标定好的训练数据,没有告诉模型哪些数据是正确的,哪些是不正确的。在非监督式学习中,学习模型是为了推断出数据的一些内在结构。
监督学习:
监督学习是机器学习中一种典型的学习方法,顾名思义,监督式学习就是有个人在旁边看着你学习,随时纠正你学习中的错误。怎么纠正呢?对错误学习给予惩罚,对正确学习给予奖励。

以上两个概念想进一步了解的,推荐阅读《神经网络与深度学习》

(3)候选答案排序与阈值
顾名思义,就是对相似度范围内的潜在问题答案的排序手法,它需要遵从置信度的阈值定义,而阈值决定展示内容的范围和类型

多轮对话的信息咨询型机器人

主要用于存在连续性问答场景的对话,它典型特点就是机器人需要进行问题条件的挖掘,同时会继承上一轮话题,并以此完成多轮对话的连续性和逻辑性,是单轮机器人的进一步升级

知识图谱型机器人KG-Bot

知识图谱机器人核心在于知识图谱与普通知识库的差异,知识图谱是基于提高问答准确度而出现的知识结构,因此理解此类机器人,便是理解知识图谱

(1)知识图谱的优势

  • 在对话结构和流程的设计中支持实体间的上下文会话识别与推理
  • 通常在一般型问答的准确率相对比较高(当然具备推理型场景的需要特殊的设计)

(2)知识图谱的构建

基本流程
数据爬取—>数据解析(实体、关系、属性)—>数据插入—>关系建立。

知识图谱的核心特点
拥有知识推断能力,能更直接回答用户的问题。

逻辑结构——数据层和模式层

数据层:一般存在两种三元组作为事实的表达方式。这两种三元组为:“实体—关系—实体”、“实体—属性—值”。

模式层:构建在数据层之上,主要是通过本体库来规范数据层的一系列事实表达。本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。

image.png

张三 is_father_of 李四: 张三、李四是实体,is_father_of是关系,指张三是李四的父亲。李四 has_phone 电话:电话也是实体,关系是has_phone。再在电话上加上属性如“开通时间”、“号码”,以及相应的值。这些通过预设定好的关系进行实体之间关系的定义最终形成知识图谱。

特别注意:
1.由于实体是知识图谱中的最基本元素,其抽取的完整性、准确率、召回率等将直接影响到知识图谱构建的质量。
2.把用户问题转化为知识图谱上的查询语言是实践应用中的难点,需要意图识别—>实体识别—>属性识别—>问题分类等步骤的处理

知识图谱基础知识了解

知识点1:知识图谱的定义
知识图谱是Google用于增强其搜索引擎功能的知识库。本质上, 知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成

知识点2:知识图谱中包含三种节点

  • 实体:指的是具有可区别性且独立存在的某种事物。如某一个人、某一个城市、某一种植物等、某一种商品等等。世界万物有具体事物组成,此指实体。如图1的“中国”、“美国”、“日本”等。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。
    • 语义类(概念):具有同种特性的实体构成的集合,如国家、民族、书籍、电脑等。 概念主要指集合、类别、对象类型、事物的种类,例如人物、地理等。
    • 内容:通常作为实体和语义类的名字、描述、解释等,可以由文本、图像、音视频等来表达。
  • 属性(值):从一个实体指向它的属性值。不同的属性类型对应于不同类型属性的边。属性值主要指对象指定属性的值。如“面积”、“人口”、“首都”是几种不同的属性。属性值主要指对象指定属性的值,例如960万平方公里等。
  • 关系:形式化为一个函数,它把kk个点映射到一个布尔值。在知识图谱上,关系则是一个把kk个图节点(实体、语义类、属性值)映射到布尔值的函数。

知识点3:知识图谱构建图
image.png

更多详细了解:

2.任务型机器人Task-Bot

主要目的是为用户完成某项任务,这类用户问题通常是需要调用第三方接口返回结果的。目标是在多轮交互中不断理解用户的意图,和根据用户的意图结果优化排序的结果和交互的过程。

任务型场景的三个要素是:领域、意图、参数
image.png

意图的配置中包含的要素有:意图上下文(即语境)、用户表述、参数(含追问提示语句)、回复。

image.png

3.闲聊型机器人Chat-Bot

主要为休闲无目的的沟通交流,属于消耗型的对话系统,核心可以用作休闲沟通,更多用于科学研究。典型的就是微软小冰。这里就不过多介绍了

4.补充:路由机器人 Route-Bot

最后补充一个:路由机器人,即当面对庞大的业务场景,由于不同类型的问答需要不同类型的机器人,因此基于服务需求,完成选择哪种类型机器人的匹配的路由机器人便得到了应用,它的核心流程,也是一个便于理解的内容。

image.png

综上所述,智能客服机器人的各种策略机制,都是基于NLP的核心应用,它贯穿了流程的每个环节,由此衍生了很多领域的应用

  • 客服机器人(阿里客服小蜜)
  • 助理机器人(天猫精灵)
  • 情感陪聊机器人(微软小冰)
  • 理财机器人(支付宝智能助理小钻风)
  • 企业前台机器人和企业内部机器人(钉钉智能工作助理)

同时在交互设计方面,也包含了文字交互、语音交互、复合交互的交互方式,这部分也是产品拓展和深度挖掘的核心点。

产品应用示例

image.png
image.png

解决了谁在什么场景的什么需求痛点?

核心用户

需要大量人工服务成本投入的大中型B端客户

核心需求

客户售前/售后存在海量重复率高/学习成本低的沟通问题,人工无法及时响应
需要以最短路径,获得更精准、更直接的答案,并能很好地完成无人的沟通任务

核心服务场景

智能对话:在线机器人、智能导航、智能外呼
智能辅助:金牌话术、 智能质检
未来智能:智能决策、智能管理

核心交互流程

image.png
说明:图片源于网络

现状是什么?

市场规模

预计2022年智能客服机器人的业务规模将为71亿元,数据来自于艾瑞咨询

竞争环境

在智能客服机器人领域,目前已经有诸多公司入局,可以通过了解各个公司的产品矩阵,进而了解当前的竞争状态。

智齿

公司简介
智齿科技将人工智能及大数据技术有效整合,构建了包括呼叫中心、机器人「在线+呼入+呼出」、 人工在线客服、工单系统等产品,贯穿「售前+售中+售后」全流程,覆盖「服务+营销+协作+管理」全场景的「客户全生命周期服务」解决方案。

产品分布:
image.png

详细介绍:

追一科技

简介
深圳追一科技有限公司是领先的人工智能公司和AI数字员工提供商,我们主攻深度学习和自然语言处理,提供智能语义,语音和视觉的AI全栈服务。我们的AI数字员工智能平台能与业务场景深度融合,提供不同类型的AI数字员工,满足企业和政府用户服务、营销、运营、 办公等多种场景的智能化升级需求,帮助他们降本提效,改善用户体验,驱动创新和增长。

产品分布:
image.png

详细介绍

Udesk

简介
Udesk ( 北京沃丰时代数据科技有限公司 ) 创立于2014年7月,是国内头部的智能客户体验解决方案提供商、智能客服领域的独角兽、SaaS领域的明星企业。依托云计算、大数据、人工智能技术,Udesk成功将全维度的智能系统应用到企业客户服务的各个场景,致力于用技术帮助企业建立体验经济时代的核心竞争力,通过卓越服务成就卓越企业。真正实现客户服务对企业经营的全面赋能

产品分布
image.png
详细介绍

网易七鱼

产品分布
image.png
image.png

详细介绍

竹间智能

简介
竹间智能由前微软(亚洲)互联网工程院副院长简仁贤先生在2015年创办,以独特的情感计算研究为核心,利用自然语言处理、深度学习、知识工程、文本处理等人工智能技术为基础,研发具有情感识别能力的对话机器人,提供6大产品涵盖Bot Factory™ 一站式的企业情感人工智能开放平台、全双工全场景AI Contact Center 平台解决方案平台、Gemini 认知知识推理平台、NLP自然语言理解平台、Scorpio 机器学习平台以及工作流自动引擎WFEA。目前在AI+金融、AI+医疗医药、AI+教育、AI+互联网、AI+智能终端、AI+传统产业等领域提供完整的解决方案。

产品分布
image.png
image.png

详细介绍

除了以上以外,还有知名厂商:BAT、搜狗、三角兽等,经过对比,可以感知所有公司的核心路线都是往平台化方式推进,以行业解决方案为B端切入点

核心技术

智能客服机器人核心技术应用:自然语言处理技术、语音技术、知识构建和自学习能力、大数据处理和挖掘等前沿技术领域
包含模块:语音识别ASR、语音合成TTS、声纹识别等
知名厂商:讯飞、BAT、搜狗、云知声、声智科技等

存在的挑战

由于智能客服本质是对话,因此核心难点自然围绕着NLP的技术实现:

  • 多样性:同个意思可以有多种表达方式
  • 歧义性:在缺少语境约束的情况下,语言有很大的歧义
  • 鲁棒性:语言在输入的过程中,尤其是经过语音识别转录过来的文本,存在多字、少字、错字、噪音、不连贯等问题
  • 知识依赖:语言连接着世界知识。
  • 语境:语言的上下文

因此,可以理解为有些问题,人本身可能也无法回答,要使智能客服机器人有所突破,便需要围绕以上几点问题,进行突破。

核心功能是什么

在线自助式对话:能够完成客户问题的自动应答
智能应答:能够更准确的回答客户提出的问题
智能呼叫:能够根据对话现场和客户数据情况,进行策略式呼叫
智能分析:质检分析、转化分析等

有什么价值

  • 降低人工成本(一般来讲能节省10%客服运营成本)、提高工作效率、提供更精准准业回答等。
  • 隐性价值在于实际场景中得到的标准化后的数据积累,可以在挖掘客服价值信息中起到降本增效的作用,后续还可以作精准营销和产品升级

收费模式是什么

智能客服的本质是工具,目前核心形态是SaaS生态服务,并结合一定的PaaS服务,因此逃不掉SaaS产品的商业逻辑,而SaaS产品的本质在于续费

模式1:年费+模块消耗付费
模式2:按版本售卖,如标准版、专业版等

产品设计思路

机器人的业务目标是提升客服效率和体验,把简单问题交给机器,复杂问题或需要情感安抚的问题交给人工。

智能客服机器人包含两部分:机器人本身的个性塑造、机器人大脑知识库构建

设计四步
1.确认对话机器人的基础建设
2.建立机器人的人设
3.设计对话
4.洞察用户提升对话体验

关于此部分理解,可以查看下方,可以有个很直观的认识

总结

首先智能客服机器人目前的商业应用大部分应用核心还是SaaS模式,所以当回归到SaaS模式下,便需要深度进行SaaS产品的定位,不过差异点在于门槛的差异,此类SaaS产品的门槛与市面上的纯行业级应用SaaS本身不属于同类SaaS,但回归商业,还是需要回归SaaS模式形态,即续费。这部分可以查看我关于SaaS产品的总结。

推荐阅读

🔥《SaaS创业路线图:to B产品、营销、运营方法论及实战案例解读》读后分享

相关说明

帮助与反馈