当前位置:首页 > 系统教程 > 正文

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南

让 Docker 拥抱 GPU:详细步骤与常见问题

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南  Docker GPU 支持 CUDA 容器 第1张

在 Ubuntu 24.04 上运行 GPU 加速的容器化应用(如深度学习、科学计算)时,NVIDIA Container Toolkit 是必不可少的工具。它允许 Docker 容器直接访问主机的 NVIDIA GPU,从而实现高性能计算。本文将提供一份小白也能轻松上手的详细指南,涵盖从环境准备到验证成功的全流程。

1. 前提条件:确保驱动与 Docker 已安装

在开始安装 NVIDIA Container Toolkit 之前,请确认你的系统满足以下条件:

  • NVIDIA 显卡驱动:已正确安装且版本 ≥ 450.80.02。可以通过命令 nvidia-smi 检查驱动状态和 CUDA 版本。
  • Docker Engine:已安装并正常运行。使用 docker --version 验证。若未安装,可参考 Docker 官方文档先完成安装。

2. 安装 NVIDIA Container Toolkit

以下步骤在 Ubuntu 24.04 上配置官方仓库并安装工具包:

  1. 设置 GPG 密钥和仓库curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | sed "s#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g" | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
  2. 更新软件包列表sudo apt update
  3. 安装 nvidia-container-toolkitsudo apt install -y nvidia-container-toolkit

3. 配置 Docker 运行时

安装完成后,需要配置 Docker 使用 NVIDIA 运行时,以便容器可以识别 GPU:

  1. 配置运行时sudo nvidia-ctk runtime configure --runtime=docker 该命令会自动修改 /etc/docker/daemon.json 文件,添加 NVIDIA Container Toolkit 运行时配置。
  2. 重启 Docker 服务sudo systemctl restart docker

4. 验证 GPU 容器支持

运行一个测试容器来确认 GPU 是否成功被 Docker 识别:

sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

如果输出显示 GPU 信息(类似 nvidia-smi 的输出),则表明 Docker GPU 支持已启用,并且 CUDA 容器可以正常调用 GPU。

5. 常见问题与排错

  • 问题:运行测试容器时提示 "could not select device driver"解决方法:确认 Docker 已重启,并检查 /etc/docker/daemon.json 是否包含 nvidia 运行时配置。
  • 问题:nvidia-smi 显示驱动正常,但容器内无法使用 GPU解决方法:尝试安装特定版本的 NVIDIA Container Toolkit 或更新 Docker 到最新版本。
  • 问题:仓库添加失败(GPG 错误)解决方法:手动下载并安装 .deb 包,或检查网络代理设置。

6. 总结

通过本指南,你在 Ubuntu 24.04 上成功安装了 NVIDIA Container Toolkit,使 Docker 能够无缝使用 GPU 资源。现在你可以部署各类 GPU 加速的容器应用,如 TensorFlow、PyTorch 等,尽情释放计算潜能。

关键词:NVIDIA Container Toolkit, Ubuntu 24.04 安装, Docker GPU 支持, CUDA 容器