Information Retrieval

浏览 75 扫码分享 2023-11-22 01:09:05

Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering
Article Reranking by Memory-enhanced Key Sentence Matching for Detecting Previously Fact-checked Claims
CoSQA: 20,000+ Web Queries for Code Search and Question Answering
- Contrastive Learning

Mutual Information Maximization Approach for the Spurious Solution Problem in Weakly Supervised Question Answering

Keywords

EM算法

Task Definition

对于QA任务，每一个实例可用表示，其中为Reference Document
记为solution，即文档中的一块特定区域
记为task-specific function，即将solution转化为对应的answer
训练目标：训练模型，其将作为输入，并提供solution，使
Learning Method
训练目标是为了优化模型，使之间的条件互信息最大化：

Information Retrieval - 图12 是 Information Retrieval - 图13 的后验概率分布，其中 Information Retrieval - 图14 是solution set
Information Retrieval - 图15

由于 Information Retrieval - 图16 是不可计算的，因此我们引入了一个重构question的模块 Information Retrieval - 图17 ，并通过 Information Retrieval - 图18 来近似地估计 Information Retrieval - 图19 ，其中 Information Retrieval - 图20 即indicator function
Information Retrieval - 图21

step 1：首先最小化，也就是优化，使尽可能逼近。具体操作即从中 sample，并使最大化
step 2：最大化，将作为reward function，最大化，其中
Article Reranking by Memory-enhanced Key Sentence Matching for Detecting Previously Fact-checked Claims
https://zhuanlan.zhihu.com/p/393615707
CoSQA: 20,000+ Web Queries for Code Search and Question Answering
Contrastive Learning

将query进行rewrite，随后将改写后的query再代入以上两式中得到新的loss。该举是为了使模型具有泛化能力，适应不同的query

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录