当前位置:首页 > 系统教程 > 正文

Ubuntu 24.04安装NVIDIA Container Toolkit全指南

Ubuntu 24.04安装NVIDIA Container Toolkit全指南

让Docker拥抱GPU,解锁容器化AI计算新境界

在深度学习和人工智能领域,GPU加速已成为不可或缺的技术。为了在容器化环境中高效利用GPU,NVIDIA推出了NVIDIA Container Toolkit,它允许Docker容器直接访问宿主机的GPU资源。本教程将详细介绍在Ubuntu 24.04系统上安装和配置NVIDIA Container Toolkit的全过程,即使你是初学者,也能轻松跟随步骤完成设置,实现Docker GPU支持,享受容器化GPU加速的便利。

Ubuntu 24.04安装NVIDIA Container Toolkit全指南 24.04  NVIDIA Toolkit Docker GPU 容器化GPU加速 第1张

前提条件

在开始安装之前,请确保你的系统满足以下条件:

  • 运行Ubuntu 24.04操作系统
  • 已安装NVIDIA显卡驱动。如果你尚未安装,可以参考官方文档或使用sudo apt install nvidia-driver-550(版本可能变化)进行安装。
  • 已安装Docker引擎。如果未安装,可以通过sudo apt install docker.io或参考Docker官方指南安装。

确保系统已更新:sudo apt update && sudo apt upgrade -y

步骤一:安装NVIDIA Container Toolkit

首先,添加NVIDIA Container Toolkit的仓库。打开终端,执行以下命令:

    distribution=$(. /etc/os-release;echo $ID$VERSION_ID)curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpgcurl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | sed "s#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g" | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list  

然后,更新软件包列表并安装NVIDIA Container Toolkit:

    sudo apt updatesudo apt install -y nvidia-container-toolkit  

步骤二:配置Docker以使用NVIDIA Container Toolkit

安装完成后,需要配置Docker守护进程以使用NVIDIA作为默认运行时。运行以下命令:

    sudo nvidia-ctk runtime configure --runtime=docker  

这将自动修改Docker的配置文件。然后,重启Docker服务使更改生效:

    sudo systemctl restart docker  

步骤三:验证安装

为了确保NVIDIA Container Toolkit和Docker GPU支持已正确安装,运行一个测试容器。执行以下命令:

    sudo docker run --rm --runtime=nvidia --gpus all nvidia/cuda:12.0-base nvidia-smi  

如果安装成功,你将看到类似以下输出,显示GPU信息:

    +-----------------------------------------------------------------------------+| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15                ||-------------------------------+----------------------+----------------------+| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC || Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. ||                               |                      |               MIG M. ||===============================+======================+======================||   0  NVIDIA GeForce ...  On   | 00000000:01:00.0 Off |                  N/A || N/A   50C    P0    N/A /  N/A |    100MiB /  4096MiB |      0%      Default ||                               |                      |                  N/A |+-------------------------------+----------------------+----------------------+  

这表明Docker已经成功拥抱GPU,你可以开始在容器中运行需要GPU加速的应用了。

常见问题与解决方案

如果在安装过程中遇到问题,请检查以下几点:

  • 确保NVIDIA驱动已正确安装,并且GPU被系统识别。运行nvidia-smi在宿主机上验证。
  • 确认Docker服务正在运行:sudo systemctl status docker
  • 如果测试容器失败,尝试重新配置运行时:sudo nvidia-ctk runtime configure --runtime=docker并重启Docker。

通过本教程,你应该已经在Ubuntu 24.04上成功安装了NVIDIA Container Toolkit,并配置了Docker GPU支持。现在,你可以利用容器化技术轻松部署AI模型和深度学习应用,享受GPU带来的计算加速。无论是在开发还是生产环境,Ubuntu 24.04配合NVIDIA Container Toolkit都能提供稳定的Docker GPU支持,实现高效的容器化GPU加速