先说一些典型会出现的情况:

    • train loss 不断下降,dev(或test) loss不断下降:说明网络仍在学习;
    • train loss 不断下降,dev(或test) loss趋于不变:说明网络过拟合;
    • train loss 趋于不变,dev(或test) loss不断下降:说明数据集100%有问题;
    • train loss 趋于不变,dev(或test) loss趋于不变:说明学习遇到瓶颈,需要减小学习率或批量数目;或者是数据集有问题(数据集标注错误数据比较多)
    • train loss 不断上升,dev(或test) loss不断上升:说明网络结构设计不当,训练超参数设置不当,数据集未经过清洗等问题。

    另外,请题主详细描述自己的情况,不然谁也不会知道你的问题出在哪里。