识别疑问句、反问句、陈述句等常见句式,辅助对话意图和对话动作的识别,改善对话系统回复的生成。

一、中文句子类型主要类别

1、陈述句(statement)

主语为首(subject_front),例:大家对这件事都很热心
主题为首(theme_front),例:红绿灯,真好玩
复合句(complex),例:他们飞的好高好远,穿过白云,越过海洋

2、特殊句(special)

把字句(ba_struct),例:阳光把冷冷的冬天赶走了
被字句(bei_struct),例:衣服被雨淋湿了
存在句(exist),例:门口有两头狮子
感叹句(sigh),例:真谢谢你!
祈使句(Imperative),例:小心!
连字句(lian_struct),例:我不但眼睛不舒服,好像连耳朵也优点疼
是字句(shi_struct),例:我的爸爸是老师
比较句(compare),例:我的力气比你大

3、疑问句(question)

疑问词问句(特指问句)

特指问句中的疑问词语绝大多数为疑问代词,如“谁、哪儿、什么”等;还有一些疑问词语为“多+adj”格式,如“多大、多高、多长”等。
例:你什么时候回来。

是非问句(whether)

主要特点是回答时用肯定或者否定答句,是非问句一般用语气助词“吗”;比如:会|是…吗,好吗,对吗,是吗,可以吗,能吗,信吗,会吗,怕吗,算吗等。

选择问句(choice)

选择问句用选择形式提出两种(或多种)不同情况,要求对方选择其中一种情况作为回答。选择问句常用“是……还是……”连接,“是”也可以省略。
例:他是坐火车来的,还是坐汽车来的

正反问句(pos_and_neg)

正反问句是把谓语的肯定形式和否定形式并列起来然后提问的疑问句,回答者可选择其中之一作为回答。正反问句可以在句尾加或者不加“呢”,但是不能加“吗”。
比如:会不会,是不是,能不能,信不信,怕不怕,可不可以,算不算等。
例:你怕不怕风吹

反问句(contrary)

反问句是用疑问句的形式来表示肯定或否定的意义,带有很强的强调意味。比如:难到,难道不,怎么会,怎能,怎么能,莫非,难不成,不是吗等。
例:难道你不喜欢他吗

二、如何判断一句话是否为疑问句?

方法包括规则表达式和疑问句判别分类模型。

  • 规则表达式:发现中文问句的表达规律,建立规则表达式库,通过规则引擎进行匹配。比如以“吗、?什么”等结尾的句子。
  • 疑问句判别分类模型:将疑问句挖掘转换为分类模型:即疑问句和非疑问句,通过人工标注数据,训练模型,完成疑问句判别任务。常用的分类模型如TextCNN等。
  1. 助词“吗”和“呢”放在句末
  2. 除了“吗”和“呢”,我们可以在句末加上“好吗”或“可以吗”
  3. 汉语中的助词“什么”、“怎么”、“哪里”、“谁”、“为什么”用于问“什么”、“如何”、“在哪里”、“谁”和“为什么”
  4. 问某事或某人有多少或多少时,可使用“几”、“多”
  5. 疑问句的另一种结构是“动词-不-动词”格式,也就是说,动词后面跟着“不”(bù)