cuda-profiling鏡像包含CUDA以及GPU效能探測和分析工具ecos,旨在簡化開發人員在容器化環境中對基於CUDA的應用程式進行效能分析的流程。
GPU Profiling說明
在排查線上GPU效能問題時,可以開啟線上GPU Profiling功能以收集詳細的資料指標,並對這些資訊進行人工分析,以確定根本原因。目前,ecos的GPU Profiling能力具備以下關鍵特性:
無侵入探測方式:您不需要對鏡像或作業代碼進行任何修改,也無需更換Python或基礎庫(CUDA)。
靈活的開啟與關閉方式:在作業運行期間,可隨時按需進行開啟或關閉。
更低的效能開銷:支援自訂採集指標,可根據任意時間長度或作業關鍵點觸發特定階段的資料。
資料標準化輸出:支援採集核函數等關鍵計量,並能夠將資料持久化為標準化資料格式,以便在TensorBoard等平台進行展示和分析。
自訂探測邏輯:使用者可基於
uBPF自行編程探針程式,針對不同的情境可在不同位置開啟不同的監控指標。
鏡像列表
鏡像類別 | 地址 |
cuda-profiling for cuda 12.9.0 | ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.9.0-runtime-ubuntu24.04 |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.9.0-runtime-cudnn9-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.9.0-devel-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.9.0-devel-cudnn9-ubuntu24.04 | |
cuda-profiling for cuda 12.8.1 | ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.1-runtime-ubuntu24.04 |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.1-runtime-cudnn9-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.1-devel-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.1-devel-cudnn9-ubuntu24.04 | |
cuda-profiling for cuda 12.8.0 | ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.0-runtime-ubuntu24.04 |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.0-runtime-cudnn9-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.0-devel-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.8.0-devel-cudnn9-ubuntu24.04 | |
cuda-profiling for cuda 12.6.3 | ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-runtime-py310-alinux3.2104 |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-runtime-cudnn9-py310-alinux3.2104 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-devel-py310-alinux3.2104 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-devel-cudnn9-py310-alinux3.2104 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-runtime-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-runtime-cudnn9-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-devel-ubuntu24.04 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.6.3-devel-cudnn9-ubuntu24.04 | |
cuda-profiling for cuda 12.1.1 | ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.1.1-runtime-py310-alinux3.2104 |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.1.1-runtime-cudnn9-py310-alinux3.2104 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.1.1-devel-py310-alinux3.2104 | |
ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/cuda-profiling:1.2.2-cuda12.1.1-devel-cudnn9-py310-alinux3.2104 |
鏡像內容
cuda-profiling:1.2.2-cuda12.9.0-runtime-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-9 | 12.9.37-1 |
cuda-cupti-12-9 | 12.9.19-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.9.0-runtime-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-9 | 12.9.37-1 |
cuda-cupti-12-9 | 12.9.19-1 | |
libcudnn9-cuda-12 | 9.9.0.52-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.9.0-devel-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-9 | 12.9.37-1 |
cuda-cudart-dev-12-9 | 12.9.19-1 | |
cuda-cupti-12-9 | 12.9.37-1 | |
cuda-cupti-dev-12-9 | 12.9.19-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.9.0-devel-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-9 | 12.9.37-1 |
cuda-cudart-dev-12-9 | 12.9.19-1 | |
cuda-cupti-12-9 | 12.9.37-1 | |
cuda-cupti-dev-12-9 | 12.9.19-1 | |
libcudnn9-cuda-12 | 9.9.0.52-1 | |
libcudnn9-dev-cuda-12 | 9.9.0.52-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.1-runtime-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.90-1 |
cuda-cupti-12-8 | 12.8.90-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.1-runtime-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.90-1 |
cuda-cupti-12-8 | 12.8.90-1 | |
libcudnn9-cuda-12 | 9.8.0.87-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.1-devel-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.90-1 |
cuda-cudart-dev-12-8 | 12.8.90-1 | |
cuda-cupti-12-8 | 12.8.90-1 | |
cuda-cupti-dev-12-8 | 12.8.90-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.1-devel-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.90-1 |
cuda-cudart-dev-12-8 | 12.8.90-1 | |
cuda-cupti-12-8 | 12.8.90-1 | |
cuda-cupti-dev-12-8 | 12.8.90-1 | |
libcudnn9-cuda-12 | 9.8.0.87-1 | |
libcudnn9-dev-cuda-12 | 9.8.0.87-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.0-runtime-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.57-1 |
cuda-cupti-12-8 | 12.8.57-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.0-runtime-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.57-1 |
cuda-cupti-12-8 | 12.8.57-1 | |
libcudnn9-cuda-12 | 9.7.0.66-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.0-devel-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.57-1 |
cuda-cudart-dev-12-8 | 12.8.57-1 | |
cuda-cupti-12-8 | 12.8.57-1 | |
cuda-cupti-dev-12-8 | 12.8.57-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.8.0-devel-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-8 | 12.8.57-1 |
cuda-cudart-dev-12-8 | 12.8.57-1 | |
cuda-cupti-12-8 | 12.8.57-1 | |
cuda-cupti-dev-12-8 | 12.8.57-1 | |
libcudnn9-cuda-12 | 9.7.0.66-1 | |
libcudnn9-dev-cuda-12 | 9.7.0.66-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-runtime-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinux3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cupti-12-6 | 12.6.80-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-runtime-cudnn9-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinux3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cupti-12-6 | 12.6.80-1 | |
libcudnn9-cuda-12 | 9.6.0.74-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-devel-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinux3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cudart-dev-12-6 | 12.6.77-1 | |
cuda-cupti-12-6 | 12.6.80-1 | |
cuda-cupti-dev-12-6 | 12.6.80-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-devel-cudnn9-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinux3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cudart-dev-12-6 | 12.6.77-1 | |
cuda-cupti-12-6 | 12.6.80-1 | |
cuda-cupti-dev-12-6 | 12.6.80-1 | |
libcudnn9-cuda-12 | 9.6.0.74-1 | |
libcudnn9-dev-cuda-12 | 9.6.0.74-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-runtime-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cupti-12-6 | 12.6.80-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-runtime-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cupti-12-6 | 12.6.80-1 | |
libcudnn9-cuda-12 | 9.6.0.74-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-devel-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cudart-dev-12-6 | 12.6.77-1 | |
cuda-cupti-12-6 | 12.6.80-1 | |
cuda-cupti-dev-12-6 | 12.6.80-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.6.3-devel-cudnn9-ubuntu24.04
類別 | 組件 | 版本 |
BaseOS | Ubuntu | 24.04 |
系統組件 | Python3 | 3.12.7 |
CUDA庫 | cuda-cudart-12-6 | 12.6.77-1 |
cuda-cudart-dev-12-6 | 12.6.77-1 | |
cuda-cupti-12-6 | 12.6.80-1 | |
cuda-cupti-dev-12-6 | 12.6.80-1 | |
libcudnn9-cuda-12 | 9.6.0.74-1 | |
libcudnn9-dev-cuda-12 | 9.6.0.74-1 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.1.1-runtime-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinu3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-1 | 12.1.105 |
cuda-cupti-12-1 | 12.1.105 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.1.1-runtime-cudnn9-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinu3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-1 | 12.1.105 |
cuda-cupti-12-1 | 12.1.105 | |
libcudnn9 | 9.2.1.18 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.1.1-devel-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinu3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-1 | 12.1.105 |
cuda-cudart-devel-12-1 | 12.1.105 | |
cuda-cupti-12-1 | 12.1.105 | |
運行組件 | ecos | 1.2.2 |
cuda-profiling:1.2.2-cuda12.1.1-devel-cudnn9-py310-alinux3.2104
類別 | 組件 | 版本 |
BaseOS | Alinu3 | 3.2104 |
系統組件 | Python3 | 3.10.3 |
CUDA庫 | cuda-cudart-12-1 | 12.1.105 |
cuda-cudart-devel-12-1 | 12.1.105 | |
cuda-cupti-12-1 | 12.1.105 | |
libcudnn9 | 9.2.1.18 | |
libcudnn9-devel | 9.2.1.18 | |
運行組件 | ecos | 1.2.2 |
鏡像運行要求
cuda-profiling for cuda12.6.3系列鏡像需要nvidia-driver版本不低於560,並且與nvidia-driver的R470,R535和R550版本相容。
cuda-profiling for cuda12.1.1系列鏡像需要nvidia-drive版本不低於525,相容nvidia-driver R470。
cuda-profiling for cuda 12.8.0鏡像需要nvidia-driver版本不低於565,並且與nvidia-driver的R470、R535、R550和R560版本相容。
cuda-profiling for cuda 12.8.1鏡像需要nvidia-driver版本不低於570,並且與nvidia-driver的R470、R535、R550、R560和R565版本相容。
cuda-profiling for cuda 12.9.0系列鏡像需要nvidia-driver版本不低於575,並且與nvidia-driver的R470、R535、R550、R560、R565和R570版本相容。
重要特性
提供了無侵入、按需啟用的GPU效能分析功能的ecos GPU效能分析工具,同時支援資料持久化,並可在TensorBoard中進行展示與分析。
GPU Profiling工具
ecos使用方式可以通過ecos --help擷取。
更新記錄
2025.5 發布cuda-profiling 1.2.2 for cuda 12.9.0。
2025.4 發布cuda-profiling 1.2.2 for cuda 12.8.1。
2025.2 發布基於Alinux3.2104的cuda-profiling 1.2.2 for cuda 12.6.3鏡像。
2025.2 發布cuda-profiling 1.2.2 for cuda 12.8.0。
2025.1 發布cuda-profiling 1.2.2 for cuda 12.1.1和cuda 12.6.3。