Abstract

摘要:基于搜索的测试用例生成是元启发式搜索在测试用例生成中的应用,最近在文献中得到了大量研究。 由于理论上元启发式搜索方法的性能高度依赖于它们的超参数,因此有必要研究该领域的超参数调整。 在本文中,我们提出了一个新的度量标准(“Tuning Gain”),它估计了调整特定类的成本效益如何。 然后,我们使用源代码类的静态特征来预测“Tuning Gain”。 最后,我们根据估计的“调整收益”对调整的类进行优先级排序,并将调整预算仅用于排名靠前的类。 为了评估我们的方法,我们针对 SF110 和 SBST2018 工具竞赛等基准测试中的 19 个项目的 250 个类别,详尽分析了著名的基于搜索的测试生成工具 (EvoSuite) 的 1,200 个超参数配置。 我们使用了一种称为 Meta-GA 的调优方法,并比较了使用和不使用建议的类优先级的调优结果。 结果表明,对于低调优预算,优先级类在额外覆盖的分支方面优于替代方案(是传统全局调优的 10 倍)。 然而,随着预算的增加,类选择不会那么有效,但到目前为止,类级别的调整仍然优于全局调整。
关键词——基于搜索的测试、超参数调优、测试用例生成、源代码度量。