当前位置:首页 > 系统教程 > 正文

Ubuntu 24.04 AI深度学习环境搭建指南(NVIDIA驱动+CUDA+cuDNN完整安装教程)

欢迎来到小白也能看懂的Ubuntu 24.04深度学习环境配置教程!本文将手把手教你安装NVIDIA显卡驱动CUDAcuDNN,打造一个完整的AI深度学习训练环境。无论你是初学者还是老手,按照步骤操作都能轻松成功。

Ubuntu 24.04 AI深度学习环境搭建指南(NVIDIA驱动+CUDA+cuDNN完整安装教程) 24.04安装NVIDIA驱动 CUDA安装教程 cuDNN配置 AI深度学习环境搭建 第1张

1. 安装NVIDIA显卡驱动(Ubuntu 24.04安装NVIDIA驱动)

首先,我们需要确保系统能够识别并使用NVIDIA显卡。以下是具体步骤:

  1. 检查显卡型号:打开终端,输入 lspci | grep -i nvidia 确认显卡型号。
  2. 添加官方驱动PPAsudo add-apt-repository ppa:graphics-drivers/ppa 然后更新 sudo apt update
  3. 安装推荐驱动:执行 ubuntu-drivers devices 查看推荐版本,然后安装:sudo apt install nvidia-driver-550(版本号可能不同)。
  4. 重启系统sudo reboot
  5. 验证驱动:重启后运行 nvidia-smi,如果看到GPU信息列表,则驱动安装成功。

2. CUDA安装教程(配置CUDA工具包)

CUDA是NVIDIA的并行计算平台,深度学习框架依赖它加速计算。按照以下步骤安装:

  1. 下载CUDA runfile:访问NVIDIA官网,选择对应Ubuntu 24.04的CUDA 12.x版本,下载.run文件。
  2. 安装CUDA:进入下载目录,执行 sudo sh cuda_12.x.x_xxx_linux.run。安装时取消勾选“Driver”(因为我们已经安装了驱动),其他保持默认。
  3. 设置环境变量:编辑 ~/.bashrc,添加:export PATH=/usr/local/cuda/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH然后执行 source ~/.bashrc 生效。
  4. 验证CUDA:运行 nvcc -V 显示CUDA版本信息即成功。

3. cuDNN配置(深度学习加速库)

cuDNN是针对深度神经网络的GPU加速库,需要与CUDA配合使用。配置步骤如下:

  1. 下载cuDNN:前往NVIDIA官网,注册并下载与CUDA版本匹配的cuDNN(例如 cuDNN for CUDA 12.x)。
  2. 解压并复制:下载得到.tar.xz文件,执行 tar -xvf cudnn-linux-x86_64-8.x.x.x_cuda12-archive.tar.xz。然后复制到CUDA目录:sudo cp cudnn--archive/include/cudnn.h /usr/local/cuda/includesudo cp -P cudnn--archive/lib/libcudnn /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
  3. 验证cuDNN:查看版本 cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 或使用nvcc -V结合cuDNN测试程序。

4. 验证AI深度学习环境

最后,我们需要确保整个环境可以用于深度学习训练。可以编译一个简单的CUDA示例程序,或者安装TensorFlow/PyTorch测试GPU支持。

  • 运行 nvidia-sminvcc -V 确认驱动和CUDA正常。
  • 编译CUDA样例:cd /usr/local/cuda/samples/1_Utilities/deviceQuerysudo make./deviceQuery 显示“Result = PASS”则成功。
  • 安装深度学习框架测试:例如 pip install tensorflow 然后运行Python检查GPU是否可用。

至此,你的Ubuntu 24.04已经成功配置了完整的AI深度学习训练环境,可以开始你的AI项目了!如果在安装过程中遇到问题,欢迎留言交流。