1.3.1 会话行为研究现状
    会话行为(dialog act,后简称DA),或称对话行为,是言语行为在对话中的使用,它描述的是“一个对话参与者的交际行为,这一交际行为不仅有语义内容和交际功能,还可能有功能依附关系、修辞关系及反馈依附关系”(ISO 24617-2 2012:2)。

    语义内容指的是对话中涉及到的目标对象、目标对象之间的关系、事件等。交际功能指的是说话者向听话者示意如何去理解话语的语用功能,也就是引导听话者理解话语意图。对会话行为的研究是对自然语言本身传达的意图的研究,主要任务是对话语的交际功能进行辨识和分类。由于话语往往都是多功能的,对其进行识别和归类也有很大难度。
    **
    当前对会话行为的研究主要集中在建设对话语料库、设立对会话行为标注体系上,通过对语料库和实证进行相应分析,以此建立语言交际行为的计算模型,从而推动对话语料库、人机对话系统的建设。

    从1997年开始,国外在对话行为标注体系和标注语料库开发上进行了大量研究,在通用领域和特殊领域都有了很大的成果。通用领域的主要代表是DAMSL(Dialog Act Markup in Several Layers,Allen and Core 1997), Allen和Core在设计过程中吸收了言语行为(Speech Act)理论和毗邻对(Adjacency Pairs)理论的思想,主要针对双人对话场景,采用多维度标记模式,将对话行为分成四个维度:交际状态(communicative status,CS)、信息水平(information level,IL)、前瞻性交际功能(forward looking communicative function,FCF)和回顾性交际功能(backward looking communicative function,BCF)。
    一个话语消息单位可以从不同的维度进行标注,体现了该标注标准的通用性和灵活性。但也由于不同维度之间的组合方式很多、设计者对标记之间的互斥性考虑不够周全,导致在实际应用中不易被识别和归类,应用能力较差。

    在DAMSL这一标注体系的基础之上,Jurafsky等来自科罗拉多大学波尔得分校(UC-Boulder)的研究人员几乎在DAMSL项目进行的同时对“总机电话对话语料库”(Meteer and Taylor, 1995)进行会话行为类别标注,标注完成后进行统计分析,发现DAMSL共有220个DA标记组合,对这些标记进行聚类重组后,形成了由42个标签组成的单维度DA标记集合。这一“降维”处理大大简化了DA标记集识别和分类的难度。项目的成果“总机会话行为语料库”(Switchboard Dialog Act Corpus)可以从宾夕法尼亚大学的语言数据联盟(Linguistic Data Consortium,LDC)获取。

    图2 频率最高的15种SWBD-DAMSL会话行为类别[1](数据来源于方称宇等的研究)
    会话行为 - 图1
    针对DAMSL体系在DA维度描述上的模糊问题,Bunt对DA的维度描述进行了改进,总结归纳出11种维度。在此基础上,Bunt设计出一套基于动态解释理论(dynamic interpretation theory,DIT)的DA标注体系——DIT++(2000)。他把所有的交际功能归为两类:通用目的功能(general-purpose functions,GPFs)和特定维度功能(dimension-specific functions,DSFs)。
    特定领域的DA标注体系主要有三种:美国的TRAINS(1994)、英国的Map Task(1996)和德国的Verbmobil(1998)。这三种体系都和地点路线查询的人际对话有关。
    图3 Verbmobil会话行为体系
    会话行为 - 图2
    除上述研究成果外,国外的学者还对多人对话的DA标注体系进行了研究,包括ICSI(international computer science institute)会议记录项目(2004)和Popescu-Belis(2003)等人的研究。前者采用的也是12个集群的多维度标记方式,构建了ICSI-MRDA(meeting recorder dialogue acts)标注体系。后者是单维度的,共有29个标签,构建了MALTUS(multidimensional abstract layered tagset for utterance)标签集合。

    在通用领域和特定领域DA标注体系研究的基础上,国际标准化组织(ISO)在2012年制定了一套普适性会话行为标注体系——ISO24617-2(后简称ISO)。该标准的制定者包括DIT++体系的制定者Bunt、Map Task和Verbmobil的研究者。
    ISO体系采众家之长,充分考虑了标注的可操作性和兼容性,给出了会话行为的明确定义,并规定会话行为有九个维度:任务、自我反馈、启他反馈、话轮管理、时间管理、语篇构建、社交义务管理、自我交际管理和对方交际管理。
    所以说ISO的标注体系也是多维度标注,其基本理念是“对话中的话语通常具备一个或一种以上的交际功能”,每个话语可以标注多个会话行为类别。但在同一个维度内只有一个会话行为类别。
    **
    会话行为 - 图3
    图4 核心ISO会话行为体系
    2010年以后,随着社交媒体的广泛使用,网络会话语料(Internet Relay Conversation,IRC)的DA分析标注研究成为学界热点。这一阶段的DA标注体系设计相对简单,主要工作是在前人标注体系如SWBD-DAMSL、DIT++、ISO等基础上,根据IRC语料的实际情况对前人体系进行引用、删改、压缩,以期获得在邮件、短信、Twitter等特定领域中的DA标注标准,标注重点基本都在DIT++标准中的通用目的功能(GPFs)中,标注的高频交际功能类别有Statement、Question、Response等。

    国内对会话行为的研究在近十年刚刚萌芽,杨平(2007)提出了一套针对访谈语料的DA标注体系;方称宇、曹竞、刘晓月(2013)对SWBD-DAMSL体系和ISO体系进行对比研究,以SWBD-DA语料库为基础,将前者转化为SWBD-ISO体系,形成了一个新的语料库。王珊和刘锐(2016)的研究面向谈话类节目,建立了一个小型语料库,并对语料进行DA标注。周强(2017)的研究是对国内外研究成果的一个很好的总结,并结合汉语实际提出了一套汉语会话行为分析标注规范。他对标注单位的选择、标注体系设计给出了确切描述,并进行了实际标注工作。统计分析双人标注数据有较高的一致率,证明该体系在汉语日常会话中表现出较好的适用性。

    在人机对话领域,前人对人-人对话行为的研究和标注数据库为人机对话的实现提供了丰富的资源和应用基础。陈淑芳(2002)在用户和餐厅服务员对话场景借鉴了Verbmobil-2的标签集,在33个种类基础上进行增、删、改,最终形成了一个由23个标签组成的对话行为集。她的这个应用于餐饮业的人机对话系统在此基础上,最终在用户满意度上有合理表现。加拿大的Maluuba公司(2017)在研究人机任务型对话记忆状态信息(Frame Tracking)任务时,提出了一套由20个对话标签组成的对话行为集,这些标签既有只能用于Wizard(系统)的,也有只能用于User(人)的,也有双方都可使用的对话行为类别。

    [1] 方称宇,曹竞,刘晓月.基于语料库的最新ISO会话行为标注体系的研究:从SWBD-DAMSL到SWBD-ISO[J].当代语言学.2013(4)