GPU インスタンスのフルなコンピューティングおよびグラフィックスレンダリング性能を活用するには、NVIDIA Tesla ドライバーをインストールする必要があります。このプロセスは、インスタンス作成時に自動化することも、後続で手動インストールすることも可能です。本トピックでは、ドライバーの自動インストールまたはロード方法について説明します。
ドライバーのインストール方法
汎用コンピューティングまたはグラフィックスアクセラレーションワークロードのパフォーマンス要件に応じて、NVIDIA Tesla ドライバーの自動インストール方法を選択してください。
方法 | 説明 | 関連トピック |
パブリックイメージの使用 | GPU インスタンスを作成する際、 | |
ユーザーデータスクリプトの使用 | GPU インスタンスを作成する際、GPU ドライバーの自動インストール オプションを選択しません。代わりに、ユーザーデータ フィールドに NVIDIA Tesla ドライバーをインストールするスクリプトを指定します。 |
パブリックイメージによる自動インストール
特定の Linux オペレーティングシステム向けの パブリックイメージ では、GPU ドライバーのインストール オプションがサポートされています。パブリックイメージを選択し、同時に GPU ドライバーのインストール オプションを有効にすると、GPU インスタンス作成後に Tesla ドライバーが自動的にインストールされます。
インスタンス購入ページ に移動します。
カスタム起動 タブを選択します。
課金方法、リージョン、ネットワークおよびゾーン、インスタンスタイプ、イメージなどの設定を必要に応じて構成します。その他の設定の詳細については、「設定項目」をご参照ください。以下の表には、Tesla ドライバーの自動インストールをサポートする互換インスタンスタイプ、
イメージバージョン、およびドライバーバージョンを示します。説明NVIDIA Tesla ドライバーは物理 GPU を制御します。CUDA および cuDNN ライブラリと併用することで、高性能な GPU コンピューティングを実現します。CUDA および cuDNN ライブラリは、NVIDIA Tesla ドライバーとともにインストールされます。新規システムでは、最新版の Tesla ドライバー、CUDA、cuDNN の使用を推奨します。
対応インスタンスタイプ
対応パブリックイメージバージョン
NVIDIA Tesla ドライバーバージョン
CUDA バージョン
cuDNN バージョン
gn7e, gn7s, gn7i, gn6v, gn6i, gn6e, gn5, gn5i
ebmgn7e, ebmgn7i, ebmgn6v, ebmgn6i, ebmgn6e
ebmgn7ix, ebmgn7ex
gn8is, ebmgn8is, gn8ia, ebmgn8ia, gn8v, ebmgn8v
ebmgn9g, ebmgn9ge
Alibaba Cloud Linux 3
Ubuntu 24.04, 22.04
説明ebmgn9g および ebmgn9ge は Ubuntu 22.04 をサポートしていません。
580.126.09
13.0.2
9.19.1.2
gn7e, gn7s, gn7i, gn6v, gn6i, gn6e, gn5, gn5i
ebmgn7e, ebmgn7i, ebmgn6v, ebmgn6i, ebmgn6e
ebmgn7ix, ebmgn7ex
gn8is, ebmgn8is, gn8ia, ebmgn8ia, gn8v, ebmgn8v
Alibaba Cloud Linux 3
Ubuntu 24.04, 22.04, 20.04
580.126.09
12.8.1
9.19.1.2
gn7e, gn7s, gn7i, gn6v, gn6i, gn6e, gn5, gn5i
ebmgn7e, ebmgn7i, ebmgn6v, ebmgn6i, ebmgn6e
gn8is, ebmgn8is, gn8v, ebmgn8v, gn8ia
Alibaba Cloud Linux 3
Ubuntu 24.04, 22.04, 20.04
説明ebmgn8v、ebmgn7e、 は Ubuntu 20.04 をサポートしていません。
570.195.03
12.8.1
9.8.0.87
gn7e, gn7s, gn7i, gn6v, gn6i, gn6e, gn5, gn5i
ebmgn7e, ebmgn7i, ebmgn6v, ebmgn6i, ebmgn6e
gn8is, ebmgn8is, gn8v, ebmgn8v, gn8ia
Alibaba Cloud Linux 3
Ubuntu 22.04, 20.04, 18.04
説明ebmgn8v、ebmgn7e、 は Ubuntu 18.04 をサポートしていません。
570.195.03
12.4.1
9.2.0.82
gn7e, gn7s, gn7i, gn6v, gn6i, gn6e, gn5, gn5i
ebmgn7e, ebmgn7i, ebmgn6v, ebmgn6i, ebmgn6e
gn8is, ebmgn8is, gn8ia
Alibaba Cloud Linux 2、Alibaba Cloud Linux 3
Ubuntu 20.04、18.04
CentOS 8.x、7.x
説明ebmgn7e は Ubuntu 18.04 をサポートしていません。
535.216.03
12.1.1
8.9.7.29
gn7i、gn7e、gn7s、gn6v、gn6i、gn6e、gn5、gn5i
ebmgn7、ebmgn7i、ebmgn7e、ebmgn6v、ebmgn6i、ebmgn6e
Alibaba Cloud Linux 2、Alibaba Cloud Linux 3
Ubuntu 20.04、18.04、16.04
CentOS 8.x、7.x
Debian 10.10
説明ebmgn7e は Ubuntu 18.04 および 20.04 イメージをサポートしていません。
470.256.02
11.4.1
8.2.4
gn7、gn7i、gn7e、gn6v、gn6i、gn6e、gn5、gn5i
ebmgn7、ebmgn7i、ebmgn7e、ebmgn6v、ebmgn6i、ebmgn6e
Alibaba Cloud Linux 2
Ubuntu 20.04、18.04、16.04
CentOS 8.x、7.x
460.91.03
11.2.2
8.1.1
gn7、gn7e、gn6v、gn6i、gn6e、gn5、gn5i
ebmgn7、ebmgn7e、ebmgn6v、ebmgn6i、ebmgn6e
Alibaba Cloud Linux 2
Ubuntu 20.04、18.04、16.04
CentOS 8.x、7.x
460.91.03
11.0.2
8.1.1
8.0.4
gn6v、gn6i、gn6e、gn5、gn5i
ebmgn6v、ebmgn6i、ebmgn6e
Alibaba Cloud Linux 2
Ubuntu 18.04、16.04
CentOS 8.x、7.x
460.91.03
10.2.89
8.1.1
8.0.4
7.6.5
gn6v、gn6i、gn6e、gn5、gn5i
ebmgn6v、ebmgn6i、ebmgn6e
Ubuntu 18.04、16.04
CentOS 7.x
450.80.02
440.64.00
10.1.168
8.0.4
7.6.5
7.5.0
gn6v、gn6i、gn6e、gn5、gn5i
ebmgn6v、ebmgn6i、ebmgn6e
Ubuntu 18.04、16.04
CentOS 7.x
450.80.02
440.64.00
10.0.130
7.6.5
7.5.0
7.4.2
7.3.1
重要インスタンス作成後に
オペレーティングシステムを変更する場合は、Tesla ドライバーの自動インストールをサポートするパブリックイメージを使用してください。この機能をサポートしないパブリックイメージを選択した場合、事前に無効化する必要があります。詳細については、「オペレーティングシステム変更時の Tesla ドライバー自動インストール無効化方法」をご参照ください。pip3 install torchを使用して PyTorch 2.1.2 をインストールする場合、CUDA 12.1 をインストールする必要があります。それ以外の場合、PyTorch 使用時にエラーが発生します。詳細については、「PyTorch 使用時に「undefined symbol: __nvJitLinkAddData_12_1, version libnvJitLink.so.12」エラーが発生する」をご参照ください。
例として、gn7i インスタンスを挙げます。イメージ セクションの 公開イメージ タブで、Alibaba Cloud Linux 3.2104 LTS 64 ビットなどの Linux
オペレーティングシステムおよびバージョンを選択します。GPU ドライバーの自動インストール チェックボックスを有効にし、CUDA、ドライバー、cuDNN のバージョンを選択します。インスタンス作成後に NVIDIA Tesla ドライバーが自動的にインストールされます。
インスタンスの作成または起動後、Tesla ドライバーに関して以下の点にご注意ください。
自動インストールには約 10~20 分かかります。実際の所要時間は、インスタンスの内部ネットワーク帯域幅および vCPU 数によって異なります。インスタンスに接続してインストール進捗をモニターできます。インストール完了後、ログファイルは /root/auto_install/auto_install.log で確認できます。以下の表に、インストール中に表示されるステータスを示します。
インストール状態
表示される情報
インストール中
進行状況バーが表示されます。
インストール成功
ALL INSTALL OK というメッセージが表示されます。
インストール失敗
INSTALL FAIL というメッセージが表示されます。
重要インストール処理中は GPU を使用できません。インスタンスに対して操作を行わないでください。他の GPU 関連ソフトウェアを同時にインストールした場合、自動インストールが失敗し、インスタンスが利用不可になる可能性があります。
ページ上の指示に従って、支払いを完了します。
ユーザーデータスクリプトによるインストール
GPU インスタンスを作成する際、イメージ セクションで GPU ドライバーの自動インストール オプションを選択しない場合、ユーザーデータ フィールドに NVIDIA Tesla ドライバーをインストールするスクリプトを入力できます。
スクリプトパラメーター
自動インストールスクリプトを使用する場合、使用ケースに合わせて以下のパラメーターを変更する必要があります。
作成したインスタンスタイプおよびイメージに基づいて、対応する Tesla ドライバー、CUDA、および cuDNN ライブラリのバージョンを変更します。サポートされているバージョンの詳細については、「パブリックイメージを使用したドライバーの自動インストール」で [パブリックイメージ] を選択したときに Tesla ドライバーがサポートするイメージバージョンおよびインスタンスタイプをご参照ください。
以下の例では、Tesla ドライバーバージョンを 550.127.08、CUDA バージョンを 12.4.1、cuDNN バージョンを 9.2.0.82 に設定しています。
DRIVER_VERSION="550.127.08"
CUDA_VERSION="12.4.1"
CUDNN_VERSION="9.2.0.82"操作手順
インスタンス購入ページ に移動します。
カスタム起動 タブを選択します。
課金方法、リージョン、ネットワークおよびゾーン、インスタンスタイプ、イメージ、ユーザーデータなどの設定を必要に応じて構成します。その他の設定の詳細については、「設定項目」をご参照ください。
[高度な設定(任意)] セクションで、準備したスクリプトを [ユーザーデータ] フィールドに入力します。
独自の自動インストールスクリプトを作成できます。スクリプトのパラメーターについて詳しくは、「スクリプトのパラメータ設定」をご参照ください。
このスクリプトでは、
.runパッケージを使用して Tesla ドライバーおよびその他のモジュールをインストールします。以下にサンプルスクリプトを示します。#!/bin/sh #インストールするバージョンを入力してください DRIVER_VERSION="550.127.08" CUDA_VERSION="12.4.1" CUDNN_VERSION="9.2.0.82" IS_INSTALL_eRDMA="FALSE" IS_INSTALL_RDMA="FALSE" INSTALL_DIR="/root/auto_install" #.run を使用してドライバーおよび CUDA をインストール auto_install_script="auto_install_v4.0.sh" script_download_url=$(curl http://100.100.100.200/latest/meta-data/source-address | head -1)"/opsx/ecs/linux/binary/script/${auto_install_script}" echo $script_download_url rm -rf $INSTALL_DIR mkdir -p $INSTALL_DIR cd $INSTALL_DIR && wget -t 10 --timeout=10 $script_download_url && bash ${INSTALL_DIR}/${auto_install_script} $DRIVER_VERSION $CUDA_VERSION $CUDNN_VERSION $IS_INSTALL_RDMA $IS_INSTALL_eRDMA
ページ上の指示に従って、支払いを完了します。
説明RunInstances API オペレーションを呼び出して GPU インスタンスを作成する場合、UserData パラメーターにインストールスクリプトを渡すことで、NVIDIA Tesla ドライバーをインストールできます。詳細については、「RunInstances」をご参照ください。
インスタンス作成時に NVIDIA Tesla ドライバーを自動インストールしなかった場合、後続で手動インストールすることもできます。SSH を使用してインスタンスに接続し、ファイルを作成してスクリプト内容をコピーし、シェルスクリプトとして実行します。インスタンスへの接続方法の詳細については、「接続方法」をご参照ください。
関連ドキュメント
GPU アクセラレーションコンピューティング最適化インスタンスを作成する際に Tesla ドライバーを自動インストールまたはロードしなかった場合、後続で手動インストールする必要があります。詳細については、以下のトピックをご参照ください。