一、安装驱动

1.添加EIRepo源
rpm —import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm

2.安装nvidia-detect
yum install nvidia-detect

3.检测显卡
nvidia-detect -v
得到结果:
image.png
得到一个类似版本号的数字,该处为418.74
https://www.nvidia.com/object/linux-amd64-display-archive.html下载对应的文件。
这里下载的是NVIDIA-Linux-x86_64-418.74.run

4.准备工作

yum -y updateyum -y groupinstall “GNOME Desktop” “Development Tools” yum -y install kernel-develyum -y install epel-releaseyum -y install dkms

5.禁用nouveau
vim /etc/default/grub
# 在“GRUB_CMDLINE_LINUX”中添加
.driver.blacklist=nouveau nouveau.modeset=0grub2-mkconfig -o /boot/grub2/grub.cfg
# 生成配置vim /etc/modprobe.d/blacklist.conf
# 打开(新建)文件,加入blacklist nouveau
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img
dracut /boot/initramfs-$(uname -r).img $(uname -r)
# 更新配置,并重启reboot#开机后确认是否禁用lsmod | grep nouveau #应该返回空

6.关闭图形化界面。Ctrl+Alt+F2。init 3

6.使用’sh NVIDIA-Linux-x86_64-418.74.run —no-opengl-files安装驱动。

7.使用nvidia-smi查看显卡状态。
得到结果:
image.png

卸载:
方法1.用run包卸载
sh NVIDIA-Linux-x86_64-418.74.run —uninstall
方法2. 如果是用yum安装的,则需要命令yum list installed | grep nvidia找出安装的包,用yum remove把nvidia开头的包删除。
方法3.
/usr/bin/nvidia-uninstall

二、安装cuda

在安装cuda前,可以在 TensorFlow官网 查看cuda和cudnn相对应较合适的版本,cuda版本和驱动版本兼容可在此处查看。
这里选择cuda10和cudnn7.4。
1.在 此处 下载对应版本的离线安装包(以.run为后缀)
这里下载的是cuda_10.0.130_410.48_linux.run。
2.使用命令chmod +x cuda_10.0.130_410.48_linux.run赋予cuda安装包可执行权限
3.使用命令./cuda_10.0.130_410.48_linux.run —no-opengl-libs开始安装
4.直接按Q键,并依次按照以下输入选项并回车。
Do you accept the previously read EULA?accept/deline/quit:acceptInstall NVIDIA Accelerated Graphics Driver for Linux-86_64 410.48?(y)es/(n)o/(q)uit: nInstall the CUDA 10.0 Tookit?(y)es/(n)o/(q)uit: yEnter Tookit Location [ default is /usr/local/cuda-10.0 ]: Do you want to install a symbolic link at /usr/local/cuda? (y)es/(n)o/(q)uit: y Install the CUDA 10.0 Samples? (y)es/(n)o/(q)uit: y Enter CUDA Samples Location [ default is /root]:
未显示输入选项的直接回车即可。
5.使用vim /etc/profile.d/cuda.sh配置cuda环境变量。
插入两行
export PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
6.使用 source /etc/profile 更新配置。
7.完成安装可使用nvcc -V查看已安装cuda版本。
卸载:
/usr/local/cuda-10.0/bin/uninstall_cuda_10.0.pl

三、安装cudnn

在 此处 下载cudnn文件。
这里下载的是cudnn-10.0-linux-x64-v7.4.2.24.tgz。
1.进入压缩包所在位置,解压。
tar -xzvf cudnn-10.0-linux-x64-v7.4.2.24
2.复制相关文件到cuda特定目录下(此处cuda安装路径为/usr/local/cuda/)
sudo cp cuda/include/cudnn.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn /usr/local/cuda/lib64
3.修改文件权限
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn

4.可使用cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2查看当前cudnn版本。
卸载:
sudo rm -rf /usr/local/cuda/include/cudnn.hsudo rm -rf /usr/local/cuda/lib64/libcudnn*

四、安装docker

1.Docker 要求 CentOS 系统的内核版本高于 3.10,查看CentOS 版本是否支持 Docker 。
uname -r
2.更新包。
sudo yum update
3.卸载旧版本(第一次安装可忽略)
sudo yum remove docker docker-common docker-selinux docker-engine
4.安装需要的软件包, yum-util 提供yum-config-manager功能,另外两个是devicemapper驱动依赖的
sudo yum install -y yum-utils device-mapper-persistent-data lvm2
5.设置yum源
sudo yum-config-manager —add-repo https://download.docker.com/linux/centos/docker-ce.repo
6.查看所有仓库中所有docker版本,并选择特定版本安装。
yum list docker-ce —showduplicates | sort -r
7.安装docker。
sudo yum install docker-ce #由于repo中默认只开启stable仓库,故这里安装的是最新稳定版17.12.0$ sudo yum install # 例如:sudo yum install docker-ce-17.12.0.ce
8.启动并加入开机启动。
sudo systemctl start dockersudo systemctl enable docker
9.验证安装是否成功。
docker version

五、安装nvidia-docker

1.删除本机已安装的旧版本
docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -fsudo yum remove nvidia-docker
2.配置git上的源
curl -s -L https://nvidia.github.io/nvidia-docker/centos7/nvidia-docker.repo | \ sudo tee /etc/yum.repos.d/nvidia-docker.repo
3.安装nvidia-docker
yum install -y nvidia-docker
nvidia-docker便安装成功了。