问题复现
Tensorflow 版本 | cuda 版本 | cudnn 版本 | 错误 |
---|---|---|---|
2.3.0 | 10.1 | 7.6 | failed to run cuBLAS routine: CUBLAS_STATUS_NOT_SUPPORTED |
原因
GeForce RTX 3090 的 computeCapability 已经是 8.6。
但是 CUDA10.2 已经以下的版本全都不支持 computeCapability 8.*的。
自己摸索了很久,有以下解决方案。
方案一
Tensorflow 版本 | cuda 版本 | cudnn 版本 | 驱动 | 操作系统 |
---|---|---|---|---|
tf-nightly-gpu 2.4.0-dev20201016 或者 tensorflow 2.4.0rc0 | 11.0.228 | 8.0.3.33 | 455.23.05 | Linux zebiao-pc 5.4.0-52-generic #57~18.04.1-Ubuntu SMP Thu Oct 15 14:04:49 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux |
版本有点出入没有关系。但是 cuda 不要是 10.1, 10.2 或者 11.1。
cudnn 一定要 8.* 。
Tensorflow 刚发布新版本 2.4.0-rc0 了,可以执行
pip install tensorflow==2.4.0rc0
方案二
考虑到可能大家的代码不一定是 Tensorflow 2.4.0 能兼容。
这里提供另一个方案。
方案流程在官网有。
https://www.tensorflow.org/install/source
记得 git checkout 你代码合适的 tensorlfow 版本。
cuda、 cudnn、 驱动的版本看方案一。
然后编译新的 tensorlfow 应该就能运行了。
https://blog.csdn.net/weixin_45114252/article/details/109463521