容器 GPU 镜像实战指南:从 CUDA 基础到生产镜像的全链路 CUDA Toolkit | cuDNN | NVIDIA 基础镜像 | 多阶段构建 | 镜像瘦身 | 版本兼容 | 生产维护一、30 秒理解 GPU 容器GPU 容器和普通容器的核心区别:容器内需要 CUDA 运行时,宿主机需要 NVIDIA 驱动和 nvidia-container-toolkit。┌─────────────────────────────────────────────┐ │ 容器内(镜像负责) │ │ ├── 你的应用代码 │ │ ├── Python / PyTorch / TensorFlow │ │ ├── cuDNN(深度学习加速库) │ │ └── CUDA Toolkit(GPU 计算框架) │ ├─────────────────────────────────────────────┤ │ 容器运行时(宿主机负责) │ │ ├── nvidia-container-toolkit │ │ ├── NVIDIA Driver(如 535.xx) │ │ └── GPU 硬件(T4 / A10G / L4 / A100) │ └────────