Abstract

摘要:已经对软件工程的情感分析(SA4SE)进行了广泛的研究。 研究人员已投入大量精力开发定制工具(例如 SentiStrength-SE、SentiCR),以对软件工程 (SE) 特定内容(例如 Stack Overflow 中的讨论和代码审查评论)的情绪极性进行分类。 即便如此,仍有很大的改进空间。 最近,预训练的基于 Transformer 的模型(例如,BERT、XLNet)在自然语言处理(NLP)领域带来了相当大的突破。 在这项工作中,我们在六个 SE 数据集上对五个现有的 SA4SE 工具和四个最先进的基于 Transformer 的预训练模型的变体进行了系统评估。 我们的工作是第一个为 SA4SE 任务微调基于 Transformer 的预训练模型。 根据经验,在所有六个数据集中,我们经过微调的基于 Transformer 的预训练模型在宏观/微观平均 F1 分数方面优于现有 SA4SE 工具 6.5-35.6%。
索引词——情感分析、软件挖掘、自然语言处理、预训练模型