Contextualized Sparse Representations for Real-Time Open-Domain Question Answering

任务:Open-domain question answering can be formulated as a phrase retrieval problem(开放域的问答可归结为短语检索问题)
问题:由于短语表示模型的限制使得目前模型达不到我们期望的可扩展性、高准确率和速度
解决方法:通过上下文稀疏表示(SPARC)来增加每一个短语的嵌入表示质量
优点:通过自注意力间接学习在n-gram词汇空间中的稀疏向量(对比:直接学习方法TF-IFD,学习方面单一)
测试结果:在CuratedTREC和SQuADOpen数据集上提高了4%,CuratedTREC分数比以往的检索模型快了45%。