Pytorch学习0.01:cudnn.benchmark= True的设置">Pytorch学习0.01:cudnn.benchmark= True的设置

Pytorch学习0.01:cudnn.benchmark= True的设置

设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

应该遵循以下准则：
如果网络的输入数据维度或类型上变化不大，也就是每次训练的图像尺寸都是一样的时候，设置torch.backends.cudnn.benchmark = true 可以增加运行效率；
如果网络的输入数据在每次 iteration 都变化的话，会导致 cnDNN 每次都会去寻找一遍最优配置，这样反而会降低运行效率。

对cudnn的详细介绍