ImageNet数据介绍,本文采用的ImageNet2012数据集
训练集链接(linux系统用aria2c命令下载,130+G)
ILSVRC2012_img_train.tar(每个label样本数为1300)
http://academictorrents.com/download/a306397ccf9c2ead27155983c254227c0fd938e2.torrent
验证集链接(linux系统用aria2c命令下载,6G)
ILSVRC2012_img_val.tar(每个label样本数为50)
http://academictorrents.com/download/5d6d0df7ed81efd49ca99ea4737e0ae5e3a5f2e5.torrent
创建train和val目录,分别将上面的压缩包放入其中,如下
其中,训练集解压后是每个label目录的压缩包(不要直接解压,直接解压出来的是图片,需先创建每个label的目录),验证集解压后是每个验证集图片,如下
训练集处理流程如下:
tar -xvf ILSVRC2012_img_train.tar && rm ILSVRC2012_img_train.tarfor label_t in `ls ./n*.tar`;domkdir ${label_t:0:11};cp $label_t ${label_t:0:11};tar -xvf ${label_t:0:11}/$label_t -C ${label_t:0:11};find -name ".tar" |xargs rm -fr ;done;
验证集解压后处理流程:
可参照此脚本https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh
