多卡训练batchsize对训练过程的影响显存占用分析代码可复现提高速度的技巧节省显存的技巧提取中间层特征Spatial-Shift-Operation的5种实现策略相对位置编码的理解one-hot编码类别张量使用LMDB数据库加速文件读取梯度累加