当前位置:首页 > 系统教程 > 正文

全网最详细教你在Ubuntu20.04安装NVIDIA驱动+CUDA+cuDNN

全网最详细教你在Ubuntu20.04安装NVIDIA驱动+CUDA+cuDNN

(避坑版|图文详解,小白也能轻松搞定)

欢迎来到全网最详细的Ubuntu20.04安装NVIDIA驱动、CUDA和cuDNN教程!无论你是深度学习新手还是老手,跟着这篇教程一步步操作,保证你能够顺利搭建起强大的深度学习环境搭建平台。本文将涵盖所有常见坑点,并提供图文详解,让你少走弯路。

全网最详细教你在Ubuntu20.04安装NVIDIA驱动+CUDA+cuDNN Ubuntu20.04安装NVIDIA驱动 CUDA安装教程 cuDNN配置 深度学习环境搭建 第1张

1. 准备工作:检查硬件与系统

在开始CUDA安装教程之前,务必确认你的电脑拥有NVIDIA显卡,并且系统是Ubuntu20.04。打开终端(Ctrl+Alt+T),输入以下命令检查显卡型号:

lspci | grep -i nvidia

如果没有任何输出,说明你的电脑没有NVIDIA显卡,请停止安装。另外,还需要检查系统是否更新到最新:

sudo apt update && sudo apt upgrade -y

2. 安装NVIDIA驱动(避坑版)

驱动安装是第一步,也是最容易出问题的地方。这里推荐使用runfile方式,因为它最可控。首先,前往NVIDIA官网下载对应你显卡的最新驱动(.run文件)。为了避免nouveau冲突,需要将其加入黑名单:

sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"sudo update-initramfs -u

重启后,验证nouveau是否禁用:

lsmod | grep nouveau

若无输出,则禁用成功。接下来,停止图形界面(进入tty模式):按Ctrl+Alt+F3,登录后执行:

sudo service lightdm stop  # 或者 sudo systemctl stop gdm3

给下载的驱动文件执行权限并安装:

chmod +x NVIDIA-Linux-.runsudo ./NVIDIA-Linux-.run --no-opengl-files

安装过程中全部选择默认即可。完成后重启,运行nvidia-smi,如果看到显卡信息,则驱动安装成功。这一步完成了Ubuntu20.04安装NVIDIA驱动的核心部分。

3. CUDA安装教程(选择对应版本)

CUDA的版本需要与驱动兼容。使用nvidia-smi查看右上角的CUDA Version,这是驱动支持的最高版本。我们选择不超过该版本的CUDA进行安装。前往NVIDIA官网下载CUDA Toolkit(选择runfile方式)。例如下载CUDA 11.8:

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.runsudo sh cuda_11.8.0_520.61.05_linux.run

注意:不要选择安装驱动(因为我们已经安装过),只勾选CUDA Toolkit和示例。安装完成后,配置环境变量:

echo "export PATH=/usr/local/cuda/bin:$PATH" >> ~/.bashrcecho "export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH" >> ~/.bashrcsource ~/.bashrc

验证CUDA:nvcc -V,如果显示版本信息,说明CUDA安装教程顺利完成。

4. cuDNN配置(加速库安装)

cuDNN是深度神经网络的加速库,这里我们进行cuDNN配置。首先需要注册NVIDIA账号并下载与CUDA版本匹配的cuDNN(选择cuDNN Library for Linux)。假设下载了cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz,解压并复制文件:

tar -xvf cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xzcd cudnn-linux-x86_64-8.6.0.163_cuda11-archive/sudo cp include/cudnn.h /usr/local/cuda/include/sudo cp lib/libcudnn /usr/local/cuda/lib64/sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

验证cuDNN版本:

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

如果输出包含版本号,则cuDNN安装成功。至此,完整的深度学习环境搭建已完成。

5. 终极验证

编写一个简单的Python脚本来测试GPU可用性(需要安装tensorflow或pytorch)。例如:

python3 -c "import tensorflow as tf; print(tf.config.list_physical_devices("GPU"))"

如果能看到GPU设备列表,那么恭喜你,所有安装完美收官!

本文详细介绍了Ubuntu20.04安装NVIDIA驱动CUDA安装教程cuDNN配置以及完整的深度学习环境搭建过程,希望对你有所帮助。如果在安装中遇到任何问题,欢迎留言交流。