1.Waiting for new checkpoint……..
说来都无语,vis.py 和eval.py 的输入是checkpoint_dir,并不是checkpoint的路径啊,这个路径直接对应训练时的模型输出路径,即:train.py 中参数train_logdir的值
2.Attempting to fetch value instead of handling error Internal: no supported devices found for platform CUDA
上次运行的程序还没介绍,使用nvidia-smi查看显存使用情况。找到pid
然后kill -9 pid 杀掉程序
3.训练时加载预训练模型时,出现大量的找不到初始参数,还未解决
4.数据集中分类不均衡
- 如果出现训练后,进行图片可视化,是全黑的。多半是由于 训练数据中种类不均衡,背景太多,又或者背景权重过大(另外,当训练轮次较少,也会出现预测结果全黑的现象)