ノードに NVIDIA ドライバーをインストールする場合、ACK でサポートされているドライバーバージョンを使用する必要があります。このトピックでは、ACK でサポートされている NVIDIA ドライバーのバージョンを一覧表示します。
CUDA の概要
CUDA は、2007 年に NVIDIA によって導入された並列計算プラットフォームおよびプログラミングモデルです。CUDA は、グラフィックス処理装置 (GPU) を使用して、計算パフォーマンスを大幅に向上させます。
次の図は、CUDA アーキテクチャを示しています。CUDA ソフトウェアスタックには、ドライバーレイヤー API とランタイムレイヤー API が含まれており、これらは次の点で異なります。
ドライバー API: この API は機能が豊富ですが、使用が複雑です。
CUDA ランタイム API: この API は、一部のドライバー API をカプセル化します。一部のドライバー初期化操作を隠蔽し、より使いやすくなっています。
CUDA ドライバー API は NVIDIA ドライバー パッケージによって提供されます。CUDA ライブラリと CUDA ランタイムは CUDA Toolkit パッケージによって提供されます。

ドライバーとクラスターバージョンの互換性
次の表に、さまざまな ACK クラスターバージョンでサポートされている NVIDIA GPU ドライバーのバージョンを示します。
ACK Lingjun クラスターおよびACK Pro マネージドクラスターの Lingjun ノードの場合、GPU ドライバーはオペレーティングシステム (OS) イメージに組み込まれています。ノードラベルを使用して特定の GPU ドライバーバージョンをインストールすることはできません。同様に、ACK Edge クラスターのエッジノードプールの場合、ノードラベルを使用して特定の GPU ドライバーバージョンをインストールすることはできません。
ドライバーバージョン 510 以降では、XID 119 または XID 120 エラーが時折発生することがあります。これらのエラーが発生した場合は、トラブルシューティング情報について「GPU の使用時に XID 119 または XID 120 エラーが発生し、GPU カードが利用できなくなった場合の対処方法」をご参照ください。
ドライバーバージョン 550 は、頻繁な XID 119、120、または 31 エラーやカーネルパニックなど、一部のアプリケーションの問題を修正します。既存の GPU ノードをドライバーバージョン 550 にアップグレードしてください。
ACK は、さまざまなクラスターバージョンに対してデフォルトのドライバーバージョンを定期的に更新します。これにより、クラスターに新しく追加された GPU ノードのドライバーバージョンが変更される可能性があります。これを防ぐには、クラスター内のノードプールのドライバーバージョンを指定します。詳細については、「バージョン番号を指定してノードの GPU ドライバーバージョンをカスタマイズする」をご参照ください。
ノードプールを作成するときに、指定したドライバーバージョンが「ドライバーとオペレーティングシステムのカーネルバージョンの互換性」に記載されていない場合、ACK は自動的にデフォルトのドライバーバージョンをインストールします。最新のオペレーティングシステムと互換性のないドライバーバージョンを指定すると、ノードがクラスターに参加できない場合があります。この場合、サポートされている最新のドライバーバージョンを選択する必要があります。
OS カーネルバージョンをアップグレードすると、ノードにインストールされている GPU ドライバーが利用できなくなることがあります。この問題を解決するには、ノードプールからノードを削除してから再度追加するか、「ノードの GPU ドライバーを手動でアップグレードする」ことができます。
ドライバーバージョン 570 以降でモニタリングコンポーネントを使用する場合、コンポーネントのバージョンは ack-arms-prometheus 1.1.33 以降および ack-gpu-exporter 2.3.0 以降である必要があります。
「バージョン番号を指定してノードプールのノードの GPU ドライバーバージョンをカスタマイズする」か、「OSS URL を使用する」場合、OS イメージをアップグレードした後にオペレーティングシステムとドライバーバージョンに互換性がなくなる可能性があります。「ACK でサポートされている NVIDIA ドライバーのバージョン」を参照し、互換性のある最新のドライバーを選択してください。
クラスターバージョン | デフォルトのドライバーバージョン | カスタムドライバーバージョンのサポート | サポートされている NVIDIA ドライバーバージョン |
1.28 以降 | 535.161.07 570.169 (ecs.gn9t および ecs.ebmgn9t インスタンスタイプの場合) | はい |
以下のドライバーバージョンは、最新のオペレーティングシステムと互換性がありません。
|
1.26 | はい | ||
1.24 | はい | ||
1.22 | はい | ||
1.20 | はい |
| |
1.18.8 | 418.181.07 | はい | |
1.16.9 | 418.181.07 | はい | |
1.16.6 | 418.87.01 | いいえ | |
1.14.8 | 418.181.07 | はい |
ドライバー、GPU カード、インスタンスタイプの互換性
ドライバーとオペレーティングシステムのカーネルバージョンの互換性
カーネルバージョンと OS イメージ ID の間のマッピングの詳細については、「カーネルバージョンとイメージ ID のマッピング」をご参照ください。
ドライバーバージョン | Alibaba Cloud Linux 2 | Alibaba Cloud Linux 3 | CentOS | Ubuntu |
570.169 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート対象外の範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
570.133.20 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート対象外の範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
550.163.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
550.144.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
550.90.07 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
550.54.15 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
550.54.14 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
535.247.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
535.230.02 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
535.161.07 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
535.129.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
535.98 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
535.54.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
525.147.05 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
525.105.17 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
515.105.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
515.86.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
510.108.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
510.54 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
510.47.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
470.256.02 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, ∞) |
470.161.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] サポート対象外の範囲: [5.10.134-18.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
470.103.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
470.82.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
470.57.02 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
460.106.00 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート範囲: [5.15.0-40-generic, 5.15.0-101-generic] サポート対象外の範囲: [5.15.0-106-generic, ∞) |
460.91.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
460.73.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
460.32.03 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
450.119.04 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
450.102.04 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート範囲: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] サポート対象外の範囲: [5.10.134-15.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
450.80.02 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート対象外の範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
440.33.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート対象外の範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
418.181.07 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート対象外の範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
418.113 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート対象外の範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
418.87.01 | サポート範囲: [4.19.81-17.1.al7.x86_64, ∞) | サポート対象外の範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
410.93 | サポート範囲: [4.19.81-17.1.al7.x86_64, 4.19.91-18.al7.x86_64] サポート対象外の範囲: [4.19.91-19.1.al7.x86_64, ∞) | サポート対象外の範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, 3.10.0-957.21.3.el7.x86_64] サポート対象外の範囲: [3.10.0-1062.9.1.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
410.79 | サポート範囲: [4.19.81-17.1.al7.x86_64, 4.19.91-18.al7.x86_64] サポート対象外の範囲: [4.19.91-19.1.al7.x86_64, ∞) | サポート対象外の範囲: [5.10.23-5.al8.x86_64, ∞) | サポート範囲: [3.10.0-862.14.4.el7.x86_64, 3.10.0-957.21.3.el7.x86_64] サポート対象外の範囲: [3.10.0-1062.9.1.el7.x86_64, ∞) | サポート対象外の範囲: [5.15.0-40-generic, ∞) |
ドライバーと CUDA Toolkit の互換性
アプリケーションが使用する CUDA Toolkit のバージョンと、CUDA Toolkit と NVIDIA ドライバーのバージョンの互換性リストに基づいて、適切な NVIDIA ドライバーバージョンを選択できます。詳細については、「cuda-toolkit-release-notes」をご参照ください。
ドライバーレイヤー API バージョンの取得
NVIDIA ドライバーパッケージがノードにインストールされている場合、nvidia-smi コマンドを実行して、ドライバーバージョンと CUDA ドライバー API バージョンを表示できます。次の例では、インストールされているドライバーバージョンは 550.144.03 で、ドライバー API バージョンは 12.6 です。これは、ドライバーが最大 12.6 の CUDA ランタイム API バージョンをサポートしていることを示します。
Mon Mar 24 08:51:55 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.144.03 Driver Version: 550.144.03 CUDA Version: 12.6 |
|-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 Tesla P4 On | 00000000:00:07.0 Off | 0 |
| N/A 33C P8 7W / 75W | 0MiB / 7680MiB | 0% Default |
| | | N/A |
+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| No running processes found |
+-----------------------------------------------------------------------------------------+ランタイム API バージョンの取得
コンテナイメージに CUDA Toolkit をインストールする場合、NVIDIA が提供する CUDA ベースイメージを使用できます。CUDA Toolkit はこれらのベースイメージにプリインストール済みです。これらのベースイメージに基づいてアプリケーションコンテナイメージをビルドできます。CUDA Toolkit のバージョンに基づいて、さまざまな CUDA ベースイメージを選択することもできます。
コンテナーで GPU を使用する場合、アプリケーションで使用される CUDA ランタイム API バージョンは、アプリケーションの Docker イメージの CUDA ベースイメージによって決まります。たとえば、アプリケーションの Docker イメージが NVIDIA/CUDA:12.2.0-base-Ubuntu20.04 CUDA ベースイメージに基づいてビルドされている場合、アプリケーションで使用される CUDA ランタイム API バージョンは 12.2.0 です。