Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering
Keywords
Task Definition
- 对于QA任务,每一个实例可用
表示,其中
为Reference Document
- 记
为solution,即文档中的一块特定区域
- 记
为task-specific function,即将solution转化为对应的answer
- 训练目标:训练模型
,其将
作为输入,并提供solution
,使
Learning Method
训练目标是为了优化模型,使
之间的条件互信息最大化:
是
的后验概率分布,其中
是solution set
由于是不可计算的,因此我们引入了一个重构question的模块
,并通过
来近似地估计
,其中
即indicator function
- step 1:首先最小化
,也就是优化
,使
尽可能逼近
。具体操作即从
中 sample
,并使
最大化
- step 2:最大化
,将
作为reward function,最大化
,其中
Article Reranking by Memory-enhanced Key Sentence Matching for Detecting Previously Fact-checked Claims
https://zhuanlan.zhihu.com/p/393615707CoSQA: 20,000+ Web Queries for Code Search and Question Answering
Contrastive Learning
将query进行rewrite,随后将改写后的query再代入以上两式中得到新的loss。该举是为了使模型具有泛化能力,适应不同的query
