上次安装tensorflow已经是两年前了,tensorflow版本已经从1.x更新到了2.x,再来一遍安装更新吧,相应地CUDA、cuDNN的版本都需要更新。

一.更新NVIDIA驱动程序

1.查看驱动版本

在桌面上单击右键,选择“NVIDIA控制面板”
图片.png
弹出窗口左下角点击“系统信息”
图片.png
然后可以看到驱动程序版本,需要更新到418.x以上

2.更新驱动版本

NVIDIA官网查找选择适合自己显卡、系统的驱动,下载安装
图片.png

二.更新python

我原先用的python3.5,更新到3.7.9
更新python过程中,提示conda也需要更新,于是一并更新了:
conda update conda
conda update anaconda
conda update python

三.更新cuda和cudnn

按网上找的攻略,运行:
conda install cudatoolkit=10.1
conda install cudnn=7.6.5

不过我还是按照之前的方法,在官网下载CUDAcudnn
CUNA下载后双击,无脑安装
cudnn将压缩包解压缩后,将bin,include,lib三个文件合并复制到CUDA安装文件夹下:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1下
还有将CUDA安装目录添加到环境变量

四.更新Visual Studio

之前是VS2015,升级到VS2019
这一步我折腾了两天,因为我用的WIN7系统,现在大概没什么人用win7了吧。。。糟心的过程就不写在这儿了

五.安装tensorflow

安装GPU版本2.3.1:
pip install tensorflow-gpu==2.3.1 -i https://pypi.douban.com/simple
不过安装最新的版本也有一大劣势,就是经常会出现一些莫名其妙的报错,而网上还搜不到解决办法,而用稍旧一些的版本就没有这个烦恼了,所以大概过几天我还会回退到2.1之类的版本。。。

六.测试

import tensorflow又出现报错,而且弹出“python已停止工作”
仔细看报错信息,提到HDF5的版本问题,也说了解决办法,将”HDF5_DISABLE_VERSION_CHECK”的值设为2可解:
import os
os.environ["HDF5_DISABLE_VERSION_CHECK"] = "2"
然后再运行测试语句:
a = tf.constant([1.0, 2.0], name='a')
b = tf.constant([2.0, 3.0], name='b')
print(a)
print(b)
终于成功了。。。