当前位置:首页 > 系统教程 > 正文

Ubuntu安装NVIDIA显卡驱动、CUDA以及CuDNN工具

Ubuntu安装NVIDIA显卡驱动、CUDA以及CuDNN工具

深度学习环境配置从零开始完整指南

欢迎来到这篇详细的教程!如果你是深度学习初学者,想要在Ubuntu系统上搭建GPU环境,那么这篇文章正是为你准备的。我们将一步步完成 Ubuntu安装NVIDIA驱动CUDA安装教程CuDNN配置,最终搭建起完整的深度学习环境。无论你使用的是台式机还是服务器,只要拥有NVIDIA显卡,都可以按照本教程操作。

Ubuntu安装NVIDIA显卡驱动、CUDA以及CuDNN工具 Ubuntu安装NVIDIA驱动  CUDA安装教程 CuDNN配置 深度学习环境搭建 第1张

1. 准备工作

首先,确保你的系统是Ubuntu(推荐18.04或20.04),并拥有一块NVIDIA显卡。打开终端,执行以下命令检查显卡型号:

    lspci | grep -i nvidia  

同时,检查内核版本和gcc:

    uname -rgcc --version  

更新系统并安装必要的编译工具:

    sudo apt update && sudo apt upgrade -ysudo apt install build-essential dkms  

2. 禁用nouveau驱动

Ubuntu默认的开源nouveau驱动与NVIDIA官方驱动冲突,必须禁用。创建配置文件:

    echo "blacklist nouveau" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.confecho "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf  

更新initramfs并重启:

    sudo update-initramfs -usudo reboot  

重启后验证nouveau是否已禁用(无输出):

    lsmod | grep nouveau  

3. 安装NVIDIA驱动

前往NVIDIA官方驱动下载页面,根据你的显卡型号和系统选择对应的驱动版本,下载.run文件。或者,你可以使用PPA安装,但为了更精确的控制,我们使用runfile方式。

首先,停止图形界面:

    sudo service lightdm stop   # 如果使用lightdm# 或者sudo service gdm3 stop       # 如果使用gdm3  

进入tty文本模式(按Ctrl+Alt+F2),登录后给下载的驱动文件添加执行权限并运行:

    chmod +x NVIDIA-Linux-.runsudo ./NVIDIA-Linux-.run  

按照提示接受协议,默认选项即可。安装完成后,重启系统:

    sudo reboot  

重启后,运行 nvidia-smi 如果看到GPU信息,说明驱动安装成功。至此,Ubuntu安装NVIDIA驱动部分完成。

4. 安装CUDA

接下来进行CUDA安装教程部分。访问NVIDIA CUDA下载页面,选择Linux -> x86_64 -> Ubuntu -> 你的版本 -> runfile (local)。下载.run文件。

执行安装命令(注意不要选择安装驱动,因为已经安装):

    sudo sh cuda_*.run  

在提示中,输入accept,然后取消勾选Driver(按空格取消),其余默认安装。安装完成后,需要配置环境变量。编辑 ~/.bashrc:

    echo "export PATH=/usr/local/cuda/bin:$PATH" >> ~/.bashrcecho "export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH" >> ~/.bashrcsource ~/.bashrc  

验证CUDA是否安装成功:

    nvcc -V  

如果显示版本信息,则CUDA安装完成。

5. 配置CuDNN

最后是CuDNN配置步骤。访问NVIDIA CuDNN下载页面,需要注册并登录。选择与CUDA版本匹配的CuDNN,下载“cuDNN Library for Linux (x86_64)”的tgz压缩包。

解压并复制到CUDA目录:

    tar -xzvf cudnn-*-linux-x64-v.tgzsudo cp cuda/include/cudnn.h /usr/local/cuda/includesudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*  

验证CuDNN版本:

    cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2  

如果输出包含版本号,说明配置成功。

6. 验证完整深度学习环境

至此,你已经完成了深度学习环境搭建。可以编写一个简单的TensorFlow或PyTorch程序来测试GPU是否可用,或者编译CuDNN示例。这里简单测试一下:

    cd /usr/local/cuda/samples/1_Utilities/deviceQuerysudo make./deviceQuery  

如果显示“Result = PASS”,则一切正常。

恭喜你!现在你的Ubuntu系统已经具备了NVIDIA驱动、CUDA和CuDNN,可以开始深度学习项目了。如果在过程中遇到问题,欢迎留言交流。