ImageNet数据介绍,本文采用的ImageNet2012数据集

    训练集链接(linux系统用aria2c命令下载,130+G)
    ILSVRC2012_img_train.tar(每个label样本数为1300)
    http://academictorrents.com/download/a306397ccf9c2ead27155983c254227c0fd938e2.torrent
    验证集链接(linux系统用aria2c命令下载,6G)
    ILSVRC2012_img_val.tar(每个label样本数为50)
    http://academictorrents.com/download/5d6d0df7ed81efd49ca99ea4737e0ae5e3a5f2e5.torrent

    创建train和val目录,分别将上面的压缩包放入其中,如下
    image.png
    其中,训练集解压后是每个label目录的压缩包(不要直接解压,直接解压出来的是图片,需先创建每个label的目录),验证集解压后是每个验证集图片,如下
    image.png

    训练集处理流程如下:

    1. tar -xvf ILSVRC2012_img_train.tar && rm ILSVRC2012_img_train.tar
    2. for label_t in `ls ./n*.tar`;
    3. do
    4. mkdir ${label_t:0:11};
    5. cp $label_t ${label_t:0:11};
    6. tar -xvf ${label_t:0:11}/$label_t -C ${label_t:0:11};
    7. find -name ".tar" |xargs rm -fr ;
    8. done;

    验证集解压后处理流程:
    可参照此脚本https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh