Insight & target problem

很多之前的工作都只关注做事实不一致的检测
这篇论文瞄准了事实不一致的修改

Solution

做法就是人工构造负例作为训练样本
然后用BART
input:Document + May Fake summary
output Target :Summary

训练数据集使用CNNDM,选择30%的样例为负例

测试使用的是K2019,一个之前构造的,由多个系统产生的摘要,已经被标注了正确还是错误

Highlight

效果有点一般般

手工构造的和下游任务的真实使用环境有一点的gap

识别的正确率和修改的正确性都有一点问题
image.png
400多个正确的样例,改了39个,把5个改错了
image.png

Others