bash xxx.run --no-opengl-files 十分重要
常见问题解决 不错会出来一大串log,就看最后几行就行:
cudnn nvcc --version提示缺包的话就安装下。么有root权限就找work-around,这个博客的教程亲测有效
几个库的版本要匹配,里面还有常用的下载地址
安装了tf-gpu,但gpu还是注册失败,一看INFO信息,说是找不到cuda10.0,一看我的cuda是10.1,所以安装10.0并使得二者共存cuda11.0 和 cuda11.1都可以,亲测 ,至于cudnn可装可不装,毕竟tf-gpu1.15里面自带cudnn的头文件 (不放心也可以装cudnn,我装的是8.0.4 ( 也不是所有的tf-gpu版本都自带cudnn的头文件
参考RTX 3090的深度学习环境配置pytorch、tensorflow、keras RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置 发现3080和3090其实一样的。。whl文件不用像这篇blog这样全部离线下载,直接pip install nvidia-tensorflow-xxxx 自动会把依赖包都下载好的
我是一行一行输入的,所以发现是LD_LIBRARY_PATH丢失了的原因,顺藤摸瓜就发现是screen的问题。所以最终按照这个教程: 解决Screen 无法加载LD_LIBRARY_PATH 最终得以彻底解决。【直接配置这个就可以, 之前的都没用了2333,这里不过是记录下debug的过程】