Insight & target problemSolutionHighlightOthers Insight & target problem分析事实一致性问题 Solution要求 上下界错误越多的时候,分数要越低对于不同类型的错误都要好在不同领域都要满足要求和人的感觉保持一致 Highlight结论 人工评估和真实的数据是有必要的,伪数据有一些局限性当下的标准评估都不大行问答评估里,基于SQUAD的问答系统,基于Source产生问题的效果会更好 Others