训练自己数据集的步骤
- 准备数据集
将自己的数据集放在data
目录下,目录结构如下:
- 修改代码
新建对应【文件名】.yaml
文件,将自己的数据集路径写入,如下:
# YOLOv5 🚀 by Ultralytics, AGPL-3.0 license
# COCO128 dataset https://www.kaggle.com/ultralytics/coco128 (first 128 images from COCO train2017) by Ultralytics
# Example usage: python train.py --data coco128.yaml
# parent
# ├── yolov5
# └── datasets
# └── coco128 ← downloads here (7 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: data/datasets/coco04 # dataset root dir
train: images/train2017 # train images (relative to 'path') 128 images
val: images/train2017 # val images (relative to 'path') 128 images
test: # test images (optional)
# Classes
names:
0: 人
1: 自行车
2: 汽车
3: 摩托车
4: 飞机
5: 巴士
6: 火车
7: 卡车
8: 船
9: 交通信号灯
10: 消火栓
11: 停车标志
12: 停车计时器
13: 板凳
14: 鸟
15: 猫
16: 狗
17: 马
18: 羊
19: 牛
20: 大象
21: 熊
22: 斑马
23: 长颈鹿
24: 背包
25: 雨伞
26: 手提包
27: 领带
28: 手提箱
29: 飞盘
30: 滑雪板
31: 单板滑雪
32: 运动球
33: 风筝
34: 棒球棒
35: 棒球手套
36: 滑板
37: 冲浪板
38: 网球拍
39: 瓶子
40: 酒杯
41: 杯子
42: 叉子
43: 刀
44: 勺子
45: 碗
46: 香蕉
47: 苹果
48: 三明治
49: 橙色
50: 西兰花
51: 胡萝卜
52: 热狗
53: 披萨
54: 甜甜圈
55: 蛋糕
56: 椅子
57: 沙发
58: 盆栽植物
59: 床
60: 餐桌
61: 厕所
62: 电视
63: 笔记本电脑
64: 鼠标
65: 远程
66: 键盘
67: 手机
68: 微波炉
69: 烤箱
70: 烤面包机
71: 水槽
72: 冰箱
73: 书
74: 时钟
75: 花瓶
76: 剪刀
77: 泰迪熊
78: 吹风机
79: 牙刷
# Download script/URL (optional)
download: https://ultralytics.com/assets/coco128.zip
注意路径要对应
修改train.py
文件,将--data
参数改为自己的【文件名】.yaml
文件,如下:
parser.add_argument('--data', type=str, default=ROOT / 'data/coco04.yaml', help='dataset.yaml path') # 数据集配置文件路径
- 训练
运行train.py
文件,开始训练,如下: 测试
评估