问题复现

Tensorflow 版本 cuda 版本 cudnn 版本 错误
2.3.0 10.1 7.6 failed to run cuBLAS routine: CUBLAS_STATUS_NOT_SUPPORTED

原因

GeForce RTX 3090 的 computeCapability 已经是 8.6。
但是 CUDA10.2 已经以下的版本全都不支持 computeCapability 8.*的。

自己摸索了很久,有以下解决方案。

方案一

Tensorflow 版本 cuda 版本 cudnn 版本 驱动 操作系统
tf-nightly-gpu 2.4.0-dev20201016 或者 tensorflow 2.4.0rc0 11.0.228 8.0.3.33 455.23.05 Linux zebiao-pc 5.4.0-52-generic #57~18.04.1-Ubuntu SMP Thu Oct 15 14:04:49 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux

版本有点出入没有关系。但是 cuda 不要是 10.1, 10.2 或者 11.1。
cudnn 一定要 8.* 。
Tensorflow 刚发布新版本 2.4.0-rc0 了,可以执行
pip install tensorflow==2.4.0rc0

方案二

考虑到可能大家的代码不一定是 Tensorflow 2.4.0 能兼容。
这里提供另一个方案。
方案流程在官网有。
https://www.tensorflow.org/install/source
记得 git checkout 你代码合适的 tensorlfow 版本。
cuda、 cudnn、 驱动的版本看方案一。
然后编译新的 tensorlfow 应该就能运行了。
https://blog.csdn.net/weixin_45114252/article/details/109463521