1.与ATS对比的结果里添加上利用mutate算子得到的变异模型……并且加上retrain的效果

    1. 完善selection的结果(加上 利用mutate算子得到的变异模型构造测试用例的特征向量进而进行区分)并比较各方法retrain的表现
    • 利用通用变异算子得到的变异模型在此任务上的效果非常差,甚至不如random(在0-0.1中随机生成1000个变异模型,每个算子250个,不进行去重)
    • 如果是在测试集中挑选出错误的样本然后只用选择出的样本进行retrain,再比较在测试集上的准确率的提升各方法的差距不大。
    1. 利用类似ces中近似分布的方法对测试用例进行采样。
    • ces利用最后一个隐藏层的输出迭代选择交叉熵值最大的一组样本。
    • ATS定义了一个fitness函数来测试用例子集和整个测试集的相似性。
    1. 调研deepest中的基于概率的采样方法及其他采样方法。
    2. 分层抽样

    image.png
    image.png
    image.png
    image.png
    image.png
    image.png