GPU は、ディープ ラーニングや AI などのハイパフォーマンス コンピューティング (HPC) を実現するために Tesla ドライバーを必要とします。また、OpenGL や Direct3D、クラウド ゲーミングなどのシナリオで滑らかなグラフィックス処理を行う場合にも、このドライバーが必要です。Linux を実行する GPU コンピューティング最適化インスタンスを作成する際に Tesla ドライバーをインストールしなかった場合は、手動でドライバーをインストールする必要があります。本トピックでは、Linux を実行する GPU コンピューティング最適化インスタンスに Tesla ドライバーを手動でインストールする方法について説明します。
操作手順
この手順は、Linux を実行するすべての GPU コンピューティング最適化インスタンスに適用されます。詳細については、「GPU コンピューティング最適化インスタンス (gn/ebm/scc シリーズ)」をご参照ください。ご利用のインスタンスのオペレーティングシステムと互換性のある Linux 向け Tesla ドライバーをインストールする必要があります。
ステップ 1:NVIDIA Tesla ドライバーのダウンロード
NVIDIA ドライバー ダウンロードページにアクセスします。
説明NVIDIA ドライバーのインストールおよび設定方法の詳細については、「NVIDIA ドライバー インストール クイックスタート ガイド」をご参照ください。
検索条件を設定し、[検索] をクリックして適切なドライバーを見つけます。

以下の表に設定項目を示します。
設定項目
説明
例
Product Type
Product Series
Product Family
ご利用のインスタンスタイプに対応する GPU のプロダクトタイプ、シリーズ、ファミリーを選択します。
説明GPU インスタンスのインスタンス ID、インスタンスタイプ、オペレーティングシステムなどの詳細情報を確認する方法については、「インスタンス情報の確認」をご参照ください。
Data Center / Tesla
A-Series
NVIDIA A10
Operating system
インスタンスで使用しているイメージに対応する Linux オペレーティングシステムのバージョンを選択します。
Linux 64-bit
CUDA Toolkit version
CUDA Toolkit のバージョンを選択します。
11.4
Language
ドライバーの言語を選択します。
中国語 (簡体字)
ドライバー検索結果ページで、[さらに多くのバージョンを表示] をクリックします。
ダウンロードするドライバーを見つけ、その横にある [表示] をクリックします。
たとえば、ドライバーバージョン 470.161.03、CUDA Toolkit バージョン 11.4 の Data Center Driver for Linux x64 を選択します。
ドライバーの製品ページで、[ダウンロード] を右クリックし、[リンクのアドレスをコピー] を選択します。

Linux を実行する GPU インスタンスにリモート接続します。
詳細については、「Workbench を使用した Linux インスタンスへのログイン」をご参照ください。
次のコマンドを実行して、ドライバーのインストールパッケージをダウンロードします。
以下のコマンド例に記載されているドライバーのダウンロード URL は、ステップ 5 で取得したダウンロードリンクです。
wget https://us.download.nvidia.com/tesla/470.161.03/NVIDIA-Linux-x86_64-470.161.03.run
ステップ 2:NVIDIA Tesla ドライバーのインストール
Tesla ドライバーのインストール方法は、オペレーティングシステムによって異なります。以下に各オペレーティングシステムごとの手順を示します。
CentOS
次のコマンドを実行して、GPU インスタンスに kernel-devel および kernel-headers パッケージがインストール済みかどうかを確認します。
sudo rpm -qa | grep $(uname -r)次のような応答が返された場合、これらのパッケージはインストール済みです。応答には kernel-devel および kernel-headers パッケージのバージョン情報が含まれます。
kernel-3.10.0-1062.18.1.el7.x86_64 kernel-devel-3.10.0-1062.18.1.el7.x86_64 kernel-headers-3.10.0-1062.18.1.el7.x86_64応答に kernel-devel-* および kernel-headers-* が含まれていない場合は、カーネルバージョンに一致する kernel-devel および kernel-headers パッケージをダウンロードしてインストールする必要があります。
重要kernel-devel のバージョンがカーネルバージョンと一致しない場合、ドライバーのインストール時にコンパイルエラーが発生します。応答内の kernel-* のバージョン番号を確認し、一致するバージョンの kernel-devel をダウンロードしてください。上記のサンプル応答では、カーネルバージョンは 3.10.0-1062.18.1.el7.x86_64 です。
権限を付与して Tesla ドライバーをインストールします。
Linux 64 ビット用のドライバー (.run ファイル、例:NVIDIA-Linux-x86_64-xxxx.run) の場合、次のコマンドを実行して権限を付与し、Tesla ドライバーをインストールします。
説明.deb や .rpm など、他のフォーマットの Tesla ドライバーを使用する場合は、「NVIDIA CUDA Installation Guide for Linux」のインストール手順をご参照ください。
sudo chmod +x NVIDIA-Linux-x86_64-xxxx.runsudo sh NVIDIA-Linux-x86_64-xxxx.run次のコマンドを実行して、Tesla ドライバーが正しくインストールされたかどうかを確認します。
nvidia-smi次のような応答が返された場合、Tesla ドライバーは正常にインストールされています。

(オプション) NVIDIA Persistence Daemon を使用して Persistence-M モードを有効化します。
Tesla ドライバーのインストール後、Persistence-M はデフォルトで
offになっています。Persistence-M を有効にすると、ドライバーの安定性が向上します。安定したサービスを確保するため、NVIDIA Persistence Daemon を使用して Persistence-M モードを有効にしてください。詳細については、「Persistence Daemon」をご参照ください。説明Persistence-M (Persistence Mode) は、対象 GPU を初期化状態に維持するユーザー設定可能なドライバー プロパティです。
nvidia-smi -pm 1を実行して Persistence-M を有効化することは推奨されません。インスタンスの再起動後に設定が失われるなどの問題が発生する可能性があります。詳細については、「GPU インスタンスの再起動後に Persistence Mode が無効になり、ECC ステータスまたは MIG 設定が失敗する」をご参照ください。代わりに、NVIDIA Persistence Daemon を使用して Persistence-M を有効化してください。
次のコマンドを実行して、NVIDIA Persistence Daemon を起動します。
sudo nvidia-persistenced --user username # username をご利用のユーザー名に置き換えてください。次のコマンドを実行して、Persistence-M のステータスを確認します。
nvidia-smi次のような応答が返された場合、Persistence-M は
onになっています。
(オプション) システム再起動後の Persistence-M の自動有効化
システムを再起動すると、Persistence-M の
on状態は保持されません。以下の手順を実行することで、再起動後に Persistence-M プロパティを再度有効化できます。Tesla ドライバーのインストールパッケージは、サンプルスクリプトやインストーラースクリプトなどの NVIDIA インストールスクリプトを
/usr/share/doc/NVIDIA_GLX-1.0/samples/nvidia-persistenced-init.tar.bz2パスにインストールします。次のコマンドを実行して、NVIDIA インストールスクリプトを解凍・インストールします。
cd /usr/share/doc/NVIDIA_GLX-1.0/samples/ sudo tar xf nvidia-persistenced-init.tar.bz2 cd nvidia-persistenced-init sudo sh install.sh次のコマンドを実行して、NVIDIA Persistence Daemon が実行中かどうかを確認します。
sudo systemctl status nvidia-persistenced次のような応答が返された場合、NVIDIA Persistence Daemon は実行中です。
説明NVIDIA Persistence Daemon のインストールスクリプトを調整して、ご利用のオペレーティングシステムで正しく動作するようにしてください。
次のコマンドを実行して、Persistence-M が
onになっていることを確認します。nvidia-smi(オプション) 次のコマンドを実行して、NVIDIA Persistence Daemon を停止します。
NVIDIA Persistence Daemon を実行する必要がない場合は、停止できます。
sudo systemctl stop nvidia-persistenced sudo systemctl disable nvidia-persistenced
ご利用の GPU インスタンスファミリーが ebmgn8v、ebmgn7、ebmgn7e の場合、ドライバーバージョンに対応する nvidia-fabricmanager サービスをインストールする必要があります。
重要GPU インスタンスファミリーが ebmgn8v、ebmgn7、ebmgn7e の場合、ドライバーバージョンに対応する nvidia-fabricmanager サービスをインストールしないと、GPU インスタンスが正常に動作しません。
GPU インスタンスファミリーが ebmgn8v、ebmgn7、ebmgn7e 以外の場合は、この手順をスキップしてください。
nvidia-fabricmanager サービスをインストールします。
nvidia-fabricmanager サービスは、ソースコードまたはパッケージからインストールできます。以下の例は CentOS 7.x および CentOS 8.x 向けのコマンドです。以下の例では、ドライバーバージョン (driver_version) は 460.91.03 です。
driver_versionは、ステップ 1:NVIDIA Tesla ドライバーのダウンロードでダウンロードしたドライバーのバージョン番号に置き換えてください。ソースコードからのインストール
パッケージベースのインストール
次のコマンドを実行して、nvidia-fabricmanager サービスを起動します。
sudo systemctl enable nvidia-fabricmanager sudo systemctl start nvidia-fabricmanager次のコマンドを実行して、nvidia-fabricmanager サービスがインストールされているかどうかを確認します。
systemctl status nvidia-fabricmanager次の出力が表示された場合、nvidia-fabricmanager サービスは正常にインストールされています。

Ubuntu およびその他のオペレーティングシステム
権限を付与して Tesla ドライバーをインストールします。
Linux 64 ビット用のドライバー (.run ファイル、例:NVIDIA-Linux-x86_64-xxxx.run) の場合、次のコマンドを実行して権限を付与し、Tesla ドライバーをインストールします。
説明.deb や .rpm など、他のフォーマットの Tesla ドライバーを使用する場合は、「NVIDIA CUDA Installation Guide for Linux」のインストール手順をご参照ください。
sudo chmod +x NVIDIA-Linux-x86_64-xxxx.runsudo sh NVIDIA-Linux-x86_64-xxxx.run次のコマンドを実行して、Tesla ドライバーが正しくインストールされたかどうかを確認します。
nvidia-smi次のような応答が返された場合、Tesla ドライバーは正常にインストールされています。

(オプション) NVIDIA Persistence Daemon を使用して Persistence-M モードを有効化します。
Tesla ドライバーのインストール後、Persistence-M はデフォルトで
offになっています。Persistence-M を有効にすると、ドライバーの安定性が向上します。安定したサービスを確保するため、NVIDIA Persistence Daemon を使用して Persistence-M モードを有効にしてください。詳細については、「Persistence Daemon」をご参照ください。説明Persistence-M (Persistence Mode) は、対象 GPU を初期化状態に維持するユーザー設定可能なドライバー プロパティです。
nvidia-smi -pm 1を実行して Persistence-M を有効化することは推奨されません。インスタンスの再起動後に設定が失われるなどの問題が発生する可能性があります。詳細については、「GPU インスタンスの再起動後に Persistence Mode が無効になり、ECC ステータスまたは MIG 設定が失敗する」をご参照ください。代わりに、NVIDIA Persistence Daemon を使用して Persistence-M を有効化してください。
次のコマンドを実行して、NVIDIA Persistence Daemon を起動します。
sudo nvidia-persistenced --user username # username をご利用のユーザー名に置き換えてください。次のコマンドを実行して、Persistence-M のステータスを確認します。
nvidia-smi次のような応答が返された場合、Persistence-M は
onになっています。
(オプション) システム再起動後の Persistence-M の自動有効化
システムを再起動すると、Persistence-M の
on状態は保持されません。以下の手順を実行することで、再起動後に Persistence-M プロパティを再度有効化できます。Tesla ドライバーのインストールパッケージは、サンプルスクリプトやインストーラースクリプトなどの NVIDIA インストールスクリプトを
/usr/share/doc/NVIDIA_GLX-1.0/samples/nvidia-persistenced-init.tar.bz2パスにインストールします。次のコマンドを実行して、NVIDIA インストールスクリプトを解凍・インストールします。
cd /usr/share/doc/NVIDIA_GLX-1.0/samples/ sudo tar xf nvidia-persistenced-init.tar.bz2 cd nvidia-persistenced-init sudo sh install.sh次のコマンドを実行して、NVIDIA Persistence Daemon が実行中かどうかを確認します。
sudo systemctl status nvidia-persistenced次のような応答が返された場合、NVIDIA Persistence Daemon は実行中です。
説明NVIDIA Persistence Daemon のインストールスクリプトを調整して、ご利用のオペレーティングシステムで正しく動作するようにしてください。
次のコマンドを実行して、Persistence-M が
onになっていることを確認します。nvidia-smi(オプション) 次のコマンドを実行して、NVIDIA Persistence Daemon を停止します。
NVIDIA Persistence Daemon を実行する必要がない場合は、停止できます。
sudo systemctl stop nvidia-persistenced sudo systemctl disable nvidia-persistenced
ご利用の GPU インスタンスファミリーが ebmgn8v、ebmgn7、ebmgn7e の場合、ドライバーバージョンに対応する nvidia-fabricmanager サービスをインストールする必要があります。
重要GPU インスタンスファミリーが ebmgn8v、ebmgn7、ebmgn7e の場合、ドライバーバージョンに対応する nvidia-fabricmanager サービスをインストールしないと、GPU インスタンスが正常に動作しません。
GPU インスタンスファミリーが ebmgn8v、ebmgn7、ebmgn7e 以外の場合は、この手順をスキップしてください。
nvidia-fabricmanager サービスをインストールします。
nvidia-fabricmanager サービスは、ソースコードまたはパッケージからインストールできます。以下の例は Ubuntu 16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、および Ubuntu 24.04 向けのコマンドです。
driver_versionは、ステップ 1:NVIDIA Tesla ドライバーのダウンロードでダウンロードしたドライバーのバージョン番号に置き換えてください。重要Ubuntu 22.04 に nvidia-fabricmanager サービスをインストールするには、Tesla ドライバーバージョンが 515.48.07 以降である必要があります。以下の Ubuntu 22.04 向けのサンプルコードでは、ドライバーバージョン 535.154.05 を使用しています。
Ubuntu 24.04 に nvidia-fabricmanager サービスをインストールするには、Tesla ドライバーバージョンが 550.90.07 以降である必要があります。以下の Ubuntu 24.04 向けのサンプルコードでは、ドライバーバージョン 570.133.20 を使用しています。
ソースコードから
パッケージから
次のコマンドを実行して、nvidia-fabricmanager サービスを起動します。
sudo systemctl enable nvidia-fabricmanager sudo systemctl start nvidia-fabricmanager次のコマンドを実行して、nvidia-fabricmanager サービスがインストールされているかどうかを確認します。
systemctl status nvidia-fabricmanager次の応答が表示された場合、nvidia-fabricmanager サービスは正常にインストールされています。
説明nvidia-fabricmanager パッケージのバージョンは、Tesla ドライバーのバージョンと一致している必要があります。これにより、GPU が正常に動作します。Ubuntu では、パッケージから nvidia-fabricmanager サービスをインストールした場合、apt-daily サービスによってパッケージが自動的に更新される可能性があります。これにより、nvidia-fabricmanager パッケージと Tesla ドライバーのバージョン間に不一致が生じ、nvidia-fabricmanager サービスが起動できなくなり、GPU が使用できなくなることがあります。この問題の解決方法の詳細については、「nvidia-fabricmanager のバージョンが Tesla ドライバーのバージョンと不一致のため GPU が使用できない」をご参照ください。
参考
Windows を実行する GPU コンピューティング最適化インスタンスをお持ちの場合、ディープ ラーニングや AI などの汎用コンピューティング シナリオでインスタンスを使用するには、Tesla ドライバーを手動でインストールする必要があります。詳細については、「GPU コンピューティング最適化インスタンス (Windows) への Tesla ドライバーの手動インストール」をご参照ください。
GPU インスタンス作成時に Tesla ドライバーをインストールする方法については、「GPU インスタンス作成時の Tesla ドライバーの自動インストールまたは読み込み」をご参照ください。
現在インストールされている Tesla ドライバーをアンインストールする方法については、「Tesla ドライバーのアンインストール」をご参照ください。
ご利用の GPU インスタンス上のドライバーバージョンがシナリオに適していない場合、または誤ったドライバーをインストールしてインスタンスが使用できなくなった場合は、現在のドライバーをアンインストールして新しいドライバーをインストールするか、直接ドライバーをアップグレードできます。ドライバーのアップグレード方法については、「NVIDIA ドライバーのアップグレード」をご参照ください。