Nvidia Device Plugin
官方文档:
注意: 本文档仅供参考。
1. 前置条件
- NVIDIA Cuda >= 12.1
- NVIDIA drivers >= 384.81
- nvidia-docker >= 2.0 || nvidia-container-toolkit >= 1.7.0 (>= 1.11.0 to use integrated GPUs on Tegra-based systems)
- nvidia-container-runtime configured as the default low-level runtime
- Kubernetes version >= 1.10
2. 准备 GPU 节点
注意: 在执行以上操作之前,需要将 GPU 节点加入到 Kubernetes 集群中(集群中可以正常识别到 GPU 机器节点即可。)
此部分操作需要在所有 GPU 节点上面操作且仅做配置不包含 NVIDIA 驱动安装。此部分配置主要是修改 Runtime 默认使用nvidia。
这里以基于 Debian 系统的 containerd 配置示例: