Insight & target problem

整合多个数据集
标注了新的数据集
探究了构造数据和伪造数据的gap
用标注模型改进下游性能

Solution

更加细粒度的标注,统一了多种数据集的标注结果
基于实体中心的,和基于生成中心的
image.png

构造的数据和实际数据有Gap
image.png

比较不同模型的能力
一种模型是以摘要粒度的,一个摘要给一个分数 FactCC
另外一种是依赖粒度的 ,实体关系作为基本粒度 DAE

进一步的用于下游任务,检测出标注数据里可能的错误,只优化正确的数据,避免噪音,得到提升
image.png

Highlight

Others