すべてのプロダクト
Search
ドキュメントセンター

Elastic GPU Service:GPU インスタンス (Linux) への Tesla ドライバーの手動インストール

最終更新日:Jun 25, 2026

ディープラーニング、AI、OpenGL、Direct3D、クラウドゲーミングなどのワークロードでハイパフォーマンスコンピューティングやグラフィックスアクセラレーションを実現するには、GPU がその性能を最大限に発揮し、スムーズなグラフィックスレンダリングを提供できるよう、Tesla ドライバーがインストールされている必要があります。Linux の GPU コンピューティング最適化インスタンスを作成する際に Tesla ドライバーをインストールしなかった場合は、後で手動でインストールする必要があります。このトピックでは、Linux の GPU コンピューティング最適化インスタンスに Tesla ドライバーを手動でインストールする方法について説明します。

手順

このトピックは、Linux のすべての GPU コンピューティング最適化インスタンスに適用されます。詳細については、「GPU コンピューティング最適化インスタンス (gn/ebm/scc シリーズ)」をご参照ください。インスタンスのオペレーティングシステムと互換性のある Tesla ドライバーのみをインストールできます。たとえば、Linux の GPU インスタンスは、Linux 用の Tesla ドライバーのみをサポートします。

手順1:NVIDIA Tesla ドライバーのダウンロード

  1. NVIDIA ドライバーダウンロードページに移動します。

    説明

    NVIDIA ドライバーのインストールと設定の詳細については、「NVIDIA Driver Installation Quickstart Guide」をご参照ください。

  2. 検索条件を設定し、[Search] をクリックします。

    検索条件を次の表に示します。

    条件

    説明

    • 製品タイプ

    • 製品シリーズ

    • 製品ファミリー

    インスタンス内の GPU に基づいて、製品タイプ、製品シリーズ、製品ファミリーを選択します。

    説明

    インスタンス ID、インスタンスタイプ、オペレーティングシステムなど、GPU インスタンスの詳細を表示する方法については、「インスタンス情報の表示」をご参照ください。

    • Data Center / Tesla

    • A-Series

    • NVIDIA A10

    オペレーティングシステム

    インスタンスが使用するイメージに基づいて、Linux オペレーティングシステムのバージョンを選択します。

    Linux 64-bit

    CUDA Toolkit

    CUDA Toolkit のバージョンを選択します。

    11.4

    言語

    ドライバーの言語を選択します。

    日本語

    一部の GPU コンピューティング最適化インスタンスタイプにおける GPU 情報、サポートされるドライバーバージョン、および CUDA Toolkit バージョン

    項目

    gn8v

    gn8is

    gn7e

    gn7i

    gn7

    gn6e

    gn6i

    gn6v

    gn5i

    gn5

    [プロダクトタイプ]

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    Data Center / Tesla

    [製品シリーズ]

    H-Series

    L-Series

    A-Series

    A-Series

    A-Series

    V-Series

    T-Series

    V-Series

    P-Series

    P-Series

    推奨される Tesla ドライバーバージョン

    570.133.20 以降

    450.80.02 以降

    460.73.01 以降

    450.80.02 以降

    410.79 以降

    推奨される CUDA Toolkit バージョン

    CUDA Toolkit 12.4 Update 1

    CUDA Toolkit 11.0 Update 1

    CUDA Toolkit 11.2

    CUDA Toolkit 11.0 Update 1

    CUDA Toolkit 10.1 Update 2

    説明
    • 上記の表には、一部の一般的な GPU コンピューティング最適化インスタンスタイプの GPU 情報のみ記載しています。同じ GPU モデルを持つインスタンスは、同じ GPU 情報 (製品タイプ、製品シリーズ、製品ファミリー) が共通です。たとえば、ebmgn7i と gn7i の両方のインスタンスは NVIDIA A10 GPU を使用します。したがって、これら 2 つのインスタンスは製品タイプ、製品シリーズ、製品ファミリーが同じになります。

    • Tesla ドライバーと CUDA パッケージを手動でインストールする場合、ドライバーのバージョンと CUDA パッケージのバージョンに互換性があることを確認してください。詳細については、「CUDA 互換性」をご参照ください。

  3. 検索結果ページで、[Beta, Older Drivers, and More] をクリックします。

  4. ダウンロードするドライバーを見つけ、表示 をクリックします。

    たとえば、ドライバーバージョン 470.161.03、CUDA Toolkit バージョン 11.4 の Data Center Driver for Linux x64 を選択します。

  5. ドライバーの詳細ページで、ダウンロード を右クリックし、[リンクのアドレスをコピー] を選択します。

  6. Linux GPU インスタンスに接続します。

    詳細については、「パスワードまたはキーを使用して Linux インスタンスに接続する」をご参照ください。

  7. 次のコマンドを実行して、ドライバーインストールパッケージをダウンロードします。

    コマンド例のドライバーダウンロード URL は、手順5でコピーしたリンクです。

    wget https://us.download.nvidia.com/tesla/470.161.03/NVIDIA-Linux-x86_64-470.161.03.run

手順2:NVIDIA Tesla ドライバーのインストール

Tesla ドライバーのインストール方法は、オペレーティングシステムによって異なります。

CentOS

  1. 次のコマンドを実行して、kernel-devel および kernel-headers パッケージがインストールされているかどうかを確認します。

    sudo rpm  -qa | grep $(uname -r)
    • 出力に kernel-devel および kernel-headers パッケージのバージョン情報が含まれている場合、パッケージはすでにインストールされています。

      kernel-3.10.0-1062.18.1.el7.x86_64
      kernel-devel-3.10.0-1062.18.1.el7.x86_64
      kernel-headers-3.10.0-1062.18.1.el7.x86_64
    • 出力に kernel-devel-* および kernel-headers-* が見つからない場合は、カーネルバージョンに一致する kernel-devel および kernel-headers パッケージをダウンロードしてインストールします。

      重要

      kernel-devel のバージョンがカーネルのバージョンと一致しない場合、ドライバーを RPM でインストールする際にドライバーのコンパイルが失敗します。そのため、出力内の kernel-* のバージョン番号を確認し、一致する kernel-devel バージョンをダウンロードする必要があります。出力例では、カーネルバージョンは 3.10.0-1062.18.1.el7.x86_64 です。

  2. 権限を付与し、Tesla ドライバーをインストールします。

    Linux 64 ビットオペレーティングシステムの場合、NVIDIA-Linux-x86_64-xxxx.run のような .run 形式の Tesla ドライバーを使用することを推奨します。次のコマンドを実行して権限を付与し、Tesla ドライバーをインストールします。

    説明

    .deb や .rpm などの別の形式の Tesla ドライバーを使用している場合は、「NVIDIA CUDA Installation Guide for Linux」のインストール手順をご参照ください。

    sudo chmod +x NVIDIA-Linux-x86_64-xxxx.run
    sudo sh NVIDIA-Linux-x86_64-xxxx.run
  3. 次のコマンドを実行して、インストールを確認します。

    nvidia-smi

    次のような出力が表示された場合、Tesla ドライバーはインストールされています。

    [ecs-use xxx 9sgg1tZ ~]$ nvidia-smi
    Tue Sep 10 13:58:31 2024
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 470.161.03    Driver Version: 470.161.03    CUDA Version: 11.4  |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  NVIDIA A10          Off  | 00000000:00:07.0 Off |                    0 |
    |  0%   34C    P0    62W / 150W |      0MiB / 22731MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |  No running processes found                                                 |
    +-----------------------------------------------------------------------------+
  4. (オプション) NVIDIA Persistence Daemon を使用して Persistence Mode を有効にします。

    Tesla ドライバーがインストールされると、デフォルトで Persistence Mode は無効 (off) になっています。Persistence Mode を有効にすると、Tesla ドライバーはより安定して動作します。サービスの安定性を確保するために、NVIDIA Persistence Daemon を使用して Persistence Mode を有効にすることをお勧めします。詳細については、「Persistence Daemon」をご参照ください。

    説明
    • Persistence Modeは、クライアントが接続されていない場合でもターゲット GPU を初期化状態に保つための、ユーザー設定が可能なドライバープロパティです。

    • nvidia-smi -pm 1 を使用して Persistence Mode を有効にすると、インスタンスの再起動後に設定が失われるなどの問題が発生します。詳細については、「GPU インスタンスの再起動後、Persistence Mode が持続せず、ECC ステータスや MIG 機能の設定も失敗する」をご参照ください。NVIDIA Persistence Daemon を使用して Persistence Mode を有効にすることを推奨します。

    1. 次のコマンドを実行して、NVIDIA Persistence Daemon を起動します。

      sudo nvidia-persistenced --user username 
      # username をお使いのユーザー名に置き換えます。
    2. 次のコマンドを実行して、Persistence Mode のステータスを確認します。

      nvidia-smi

      返されたメッセージは、Persistence-M が有効 (on) な状態であることを示しています。

      [ecs-usexxx2q9sgg1tZ ~]$ sudo nvidia-persistenced --user ecs-user
      [ecs-usexxx2q9sgg1tZ ~]$ nvidia-smi
      Tue Sep 10 14:02:16 2024
      +-------------------------------+----------------------+----------------------+
      | NVIDIA-SMI 470.161.03   Driver Version: 470.161.03   CUDA Version: 11.4     |
      |-------------------------------+----------------------+----------------------+
      | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
      | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
      |                               |                      |               MIG M. |
      |===============================+======================+======================|
      |   0  NVIDIA A10          On   | 00000000:00:07.0 Off |                    0 |
      |  0%   33C    P8     8W / 150W |      0MiB / 22731MiB |      0%      Default |
      |                               |                      |                  N/A |
      +-------------------------------+----------------------+----------------------+
      +-----------------------------------------------------------------------------+
      | Processes:                                                                  |
      |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
      |        ID   ID                                                   Usage      |
      |=============================================================================|
      |  No running processes found                                                 |
      +-----------------------------------------------------------------------------+
  5. (オプション) システムの再起動時に Persistence Mode を有効にするように設定します。

    システムが再起動した場合、永続モードの有効な (on) 状態は失われます。永続モードを再度有効にするには、以下の操作を実行できます。

    Tesla ドライバーのインストールパッケージにより、サンプルスクリプトやインストーラースクリプトなどの NVIDIA のインストールスクリプトが /usr/share/doc/NVIDIA_GLX-1.0/samples/nvidia-persistenced-init.tar.bz2 にインストールされます。

    1. 次のコマンドを実行して、NVIDIA スクリプトを解凍してインストールします。

      cd  /usr/share/doc/NVIDIA_GLX-1.0/samples/
      sudo tar xf nvidia-persistenced-init.tar.bz2
      cd  nvidia-persistenced-init
      sudo sh install.sh
    2. 次のコマンドを実行して、NVIDIA Persistence Daemon が実行されているかどうかを確認します。

      sudo systemctl status nvidia-persistenced

      次のような出力が表示された場合、NVIDIA Persistence Daemon は実行されています。

      [ecs-user@xxx nvidia-persistenced-init]$ sudo systemctl status nvidia-persistenced
      ● nvidia-persistenced.service - NVIDIA Persistence Daemon
         Loaded: loaded (/usr/lib/systemd/system/nvidia-persistenced.service; enabled; vendor preset: disabled)
         Active: active (running) since Tue 2024-09-10 14:13:20 CST; 40s ago
        Process: 13882 ExecStart=/usr/bin/nvidia-persistenced --user nvidia-persistenced (code=exited, status=0/SUCCESS)
       Main PID: 13883 (nvidia-persiste)
          Tasks: 1 (limit: 383833)
         Memory: 196.0K
         CGroup: /system.slice/nvidia-persistenced.service
                 └─13883 /usr/bin/nvidia-persistenced --user nvidia-persistenced
      Sep 10 14:13:19 iZbp13orbqqx6m2q9sgg1tZ systemd[1]: Starting NVIDIA Persistence Daemon...
      Sep 10 14:13:19 iZbp13orbqqx6m2q9sgg1tZ nvidia-persistenced[13883]: Started (13883)
      Sep 10 14:13:20 iZbp13orbqqx6m2q9sgg1tZ systemd[1]: Started NVIDIA Persistence Daemon.
      説明

      お使いのオペレーティングシステムに合わせて NVIDIA Persistence Daemon のインストールスクリプトを調整し、正しく動作するようにできます。

    3. 次のコマンドを実行して、永続化モードが on に設定されていることを確認します。

      nvidia-smi
    4. (オプション) 次のコマンドを実行して、NVIDIA Persistence Daemon を停止します。

      NVIDIA Persistence Daemon が不要になった場合は、無効にできます。

      sudo systemctl stop nvidia-persistenced
      sudo systemctl disable nvidia-persistenced
  6. (該当する場合のみ必須) インスタンスが ebmgn8v、ebmgn7、または ebmgn7e インスタンスファミリーに属している場合は、ドライバーバージョンに一致する nvidia-fabricmanager サービスをインストールします。

    重要
    • ebmgn8v、ebmgn7、または ebmgn7e インスタンスファミリーに属するインスタンスでは、ドライバーバージョンと一致する nvidia-fabricmanager サービスがインストールされていない場合、GPU インスタンスを使用できません。

    • GPU インスタンスが ebmgn8v、ebmgn7、または ebmgn7e インスタンスファミリーに属していない場合は、この手順をスキップします。

    1. nvidia-fabricmanager サービスをインストールします。

      nvidia-fabricmanager サービスは、ソースコードまたはインストールパッケージからインストールできます。次のサンプルコマンドでは、オペレーティングシステムとして CentOS 7.x および CentOS 8.x を、ドライバーバージョンとして 460.91.03 を例として使用しています。コマンド内の driver_version を、手順1:NVIDIA Tesla ドライバーのダウンロードでダウンロードしたドライバーのバージョン番号に置き換えてください。

      • [ソースコード]

        • CentOS 7.x

          driver_version=460.91.03
          sudo yum -y install yum-utils
          sudo yum-config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repo
          sudo yum install -y nvidia-fabric-manager-${driver_version}-1
        • CentOS 8.x

          driver_version=460.91.03
          driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
          distribution=rhel8
          ARCH=$( /bin/arch )
          sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/$distribution/${ARCH}/cuda-$distribution.repo
          sudo dnf module enable -y nvidia-driver:${driver_version_main}
          sudo dnf install -y nvidia-fabric-manager-0:${driver_version}-1
      • [インストールパッケージ]

        • CentOS 7.x

          driver_version=460.91.03
          sudo wget https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/nvidia-fabric-manager-${driver_version}-1.x86_64.rpm
          sudo rpm -ivh nvidia-fabric-manager-${driver_version}-1.x86_64.rpm
        • CentOS 8.x

          driver_version=460.91.03
          sudo wget https://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/nvidia-fabric-manager-${driver_version}-1.x86_64.rpm
          sudo rpm -ivh nvidia-fabric-manager-${driver_version}-1.x86_64.rpm
    2. 次のコマンドを実行して、nvidia-fabricmanager サービスを開始します。

      sudo systemctl enable nvidia-fabricmanager
      sudo systemctl start nvidia-fabricmanager
    3. 次のコマンドを実行して、nvidia-fabricmanager サービスのステータスを確認します。

      systemctl status nvidia-fabricmanager

      次のような出力が表示されたら、nvidia-fabricmanager サービスは実行中です。

      nvidia-fabricmanager.service - NVIDIA fabric manager service
         Loaded: loaded (/lib/systemd/system/nvidia-fabricmanager.service; enabled; vendor preset: enabled)
         Active: active (running) since Mon 2021-09-13 19:14:45 CST; 1 weeks 1 days ago
        Process: 1928 ExecStart=/usr/bin/nv-fabricmanager -c /usr/share/nvidia/nvswitch/fabricmanager.cfg (code=exited, status=0/SUCCESS)
       Main PID: 2140 (nv-fabricmanage)
          Tasks: 18 (limit: 19660)
         CGroup: /system.slice/nvidia-fabricmanager.service
                 └─2140 /usr/bin/nv-fabricmanager -c /usr/share/nvidia/nvswitch/fabricmanager.cfg
      Sep 13 19:14:26 xxx systemd[1]: Starting NVIDIA fabric manager service...
      Sep 13 19:14:45 xxx nv-fabricmanager[2140]: Successfully configured all the available GPUs and NVSwitches.
      Sep 13 19:14:45 xxx systemd[1]: Started NVIDIA fabric manager service.

Ubuntu など

  1. 権限を付与し、Tesla ドライバーをインストールします。

    Linux 64 ビットオペレーティングシステムの場合、NVIDIA-Linux-x86_64-xxxx.run のような .run 形式の Tesla ドライバーを使用することを推奨します。次のコマンドを実行して権限を付与し、Tesla ドライバーをインストールします。

    説明

    .deb や .rpm などの別の形式の Tesla ドライバーを使用している場合は、「NVIDIA CUDA Installation Guide for Linux」のインストール手順をご参照ください。

    sudo chmod +x NVIDIA-Linux-x86_64-xxxx.run
    sudo sh NVIDIA-Linux-x86_64-xxxx.run
  2. 次のコマンドを実行して、インストールを確認します。

    nvidia-smi

    次のような出力が表示された場合、Tesla ドライバーはインストールされています。

    [ecs-use xxx 9sgg1tZ ~]$ nvidia-smi
    Tue Sep 10 13:58:31 2024
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 470.161.03    Driver Version: 470.161.03    CUDA Version: 11.4  |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  NVIDIA A10          Off  | 00000000:00:07.0 Off |                    0 |
    |  0%   34C    P0    62W / 150W |      0MiB / 22731MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |  No running processes found                                                 |
    +-----------------------------------------------------------------------------+
  3. (オプション) NVIDIA Persistence Daemon を使用して Persistence Mode を有効にします。

    Tesla ドライバーがインストールされると、デフォルトで Persistence Mode は無効 (off) になっています。Persistence Mode を有効にすると、Tesla ドライバーはより安定して動作します。サービスの安定性を確保するために、NVIDIA Persistence Daemon を使用して Persistence Mode を有効にすることをお勧めします。詳細については、「Persistence Daemon」をご参照ください。

    説明
    • Persistence Modeは、クライアントが接続されていない場合でもターゲット GPU を初期化状態に保つための、ユーザー設定が可能なドライバープロパティです。

    • nvidia-smi -pm 1 を使用して Persistence Mode を有効にすると、インスタンスの再起動後に設定が失われるなどの問題が発生します。詳細については、「GPU インスタンスの再起動後、Persistence Mode が持続せず、ECC ステータスや MIG 機能の設定も失敗する」をご参照ください。NVIDIA Persistence Daemon を使用して Persistence Mode を有効にすることを推奨します。

    1. 次のコマンドを実行して、NVIDIA Persistence Daemon を起動します。

      sudo nvidia-persistenced --user username 
      # username をお使いのユーザー名に置き換えます。
    2. 次のコマンドを実行して、Persistence Mode のステータスを確認します。

      nvidia-smi

      返されたメッセージは、Persistence-M が有効 (on) な状態であることを示しています。

      [ecs-usexxx2q9sgg1tZ ~]$ sudo nvidia-persistenced --user ecs-user
      [ecs-usexxx2q9sgg1tZ ~]$ nvidia-smi
      Tue Sep 10 14:02:16 2024
      +-------------------------------+----------------------+----------------------+
      | NVIDIA-SMI 470.161.03   Driver Version: 470.161.03   CUDA Version: 11.4     |
      |-------------------------------+----------------------+----------------------+
      | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
      | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
      |                               |                      |               MIG M. |
      |===============================+======================+======================|
      |   0  NVIDIA A10          On   | 00000000:00:07.0 Off |                    0 |
      |  0%   33C    P8     8W / 150W |      0MiB / 22731MiB |      0%      Default |
      |                               |                      |                  N/A |
      +-------------------------------+----------------------+----------------------+
      +-----------------------------------------------------------------------------+
      | Processes:                                                                  |
      |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
      |        ID   ID                                                   Usage      |
      |=============================================================================|
      |  No running processes found                                                 |
      +-----------------------------------------------------------------------------+
  4. (オプション) システムの再起動時に Persistence Mode を有効にするように設定します。

    システムが再起動した場合、永続モードの有効な (on) 状態は失われます。永続モードを再度有効にするには、以下の操作を実行できます。

    Tesla ドライバーのインストールパッケージにより、サンプルスクリプトやインストーラースクリプトなどの NVIDIA のインストールスクリプトが /usr/share/doc/NVIDIA_GLX-1.0/samples/nvidia-persistenced-init.tar.bz2 にインストールされます。

    1. 次のコマンドを実行して、NVIDIA スクリプトを解凍してインストールします。

      cd  /usr/share/doc/NVIDIA_GLX-1.0/samples/
      sudo tar xf nvidia-persistenced-init.tar.bz2
      cd  nvidia-persistenced-init
      sudo sh install.sh
    2. 次のコマンドを実行して、NVIDIA Persistence Daemon が実行されているかどうかを確認します。

      sudo systemctl status nvidia-persistenced

      次のような出力が表示された場合、NVIDIA Persistence Daemon は実行されています。

      [ecs-user@xxx nvidia-persistenced-init]$ sudo systemctl status nvidia-persistenced
      ● nvidia-persistenced.service - NVIDIA Persistence Daemon
         Loaded: loaded (/usr/lib/systemd/system/nvidia-persistenced.service; enabled; vendor preset: disabled)
         Active: active (running) since Tue 2024-09-10 14:13:20 CST; 40s ago
        Process: 13882 ExecStart=/usr/bin/nvidia-persistenced --user nvidia-persistenced (code=exited, status=0/SUCCESS)
       Main PID: 13883 (nvidia-persiste)
          Tasks: 1 (limit: 383833)
         Memory: 196.0K
         CGroup: /system.slice/nvidia-persistenced.service
                 └─13883 /usr/bin/nvidia-persistenced --user nvidia-persistenced
      Sep 10 14:13:19 iZbp13orbqqx6m2q9sgg1tZ systemd[1]: Starting NVIDIA Persistence Daemon...
      Sep 10 14:13:19 iZbp13orbqqx6m2q9sgg1tZ nvidia-persistenced[13883]: Started (13883)
      Sep 10 14:13:20 iZbp13orbqqx6m2q9sgg1tZ systemd[1]: Started NVIDIA Persistence Daemon.
      説明

      お使いのオペレーティングシステムに合わせて NVIDIA Persistence Daemon のインストールスクリプトを調整し、正しく動作するようにできます。

    3. 次のコマンドを実行して、永続化モードが on に設定されていることを確認します。

      nvidia-smi
    4. (オプション) 次のコマンドを実行して、NVIDIA Persistence Daemon を停止します。

      NVIDIA Persistence Daemon が不要になった場合は、無効にできます。

      sudo systemctl stop nvidia-persistenced
      sudo systemctl disable nvidia-persistenced
  5. (該当する場合のみ必須) インスタンスが ebmgn8v、ebmgn7、または ebmgn7e インスタンスファミリーに属している場合は、ドライバーバージョンに一致する nvidia-fabricmanager サービスをインストールします。

    重要
    • ebmgn8v、ebmgn7、または ebmgn7e インスタンスファミリーに属するインスタンスでは、ドライバーバージョンと一致する nvidia-fabricmanager サービスがインストールされていない場合、GPU インスタンスを使用できません。

    • GPU インスタンスが ebmgn8v、ebmgn7、または ebmgn7e インスタンスファミリーに属していない場合は、この手順をスキップします。

    1. nvidia-fabricmanager サービスをインストールします。

      nvidia-fabricmanager サービスは、ソースコードまたはインストールパッケージからインストールできます。次のコマンド例は、Ubuntu 16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、または Ubuntu 24.04 オペレーティングシステム用です。コマンド内の driver_version を、手順1:NVIDIA Tesla ドライバーのダウンロードでダウンロードしたドライバーのバージョンに置き換えてください。

      重要
      • Ubuntu 22.04 では、nvidia-fabricmanager サービスには 515.48.07 より後のバージョンの Tesla ドライバーが必要です。Ubuntu 22.04 の次の例では、ドライバーバージョン 535.154.05 を使用しています。

      • Ubuntu 24.04 では、nvidia-fabricmanager サービスには 550.90.07 より後のバージョンの Tesla ドライバーが必要です。Ubuntu 24.04 の次の例では、ドライバーバージョン 570.133.20 を使用しています。

      • [ソースコード]

        Ubuntu 16.04、Ubuntu 18.04、または Ubuntu 20.04

        driver_version=460.91.03
        driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
        distribution=$(. /etc/os-release;echo $ID$VERSION_ID | sed -e 's/\.//g')
        sudo wget https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/cuda-$distribution.pin
        sudo mv cuda-$distribution.pin /etc/apt/preferences.d/cuda-repository-pin-600
        sudo wget -qO - https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/3bf863cc.pub | sudo apt-key add -
        sudo echo "deb https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64 /" | tee /etc/apt/sources.list.d/cuda.list
        sudo apt-get update
        sudo apt-get -y install nvidia-fabricmanager-${driver_version_main}=${driver_version}-*

        Ubuntu 22.04

        driver_version=535.154.05
        driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
        distribution=$(. /etc/os-release;echo $ID$VERSION_ID | sed -e 's/\.//g')
        sudo wget https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/cuda-$distribution.pin
        sudo mv cuda-$distribution.pin /etc/apt/preferences.d/cuda-repository-pin-600
        sudo wget -qO - https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/3bf863cc.pub | sudo apt-key add -
        sudo echo "deb https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64 /" | tee /etc/apt/sources.list.d/cuda.list
        sudo apt-get update
        sudo apt-get -y install nvidia-fabricmanager-${driver_version_main}=${driver_version}-*

        Ubuntu 24.04

        driver_version=570.133.20
        driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
        distribution=$(. /etc/os-release;echo $ID$VERSION_ID | sed -e 's/\.//g')
        sudo wget https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/cuda-$distribution.pin
        sudo mv cuda-$distribution.pin /etc/apt/preferences.d/cuda-repository-pin-600
        sudo wget -qO - https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/3bf863cc.pub | sudo apt-key add -
        sudo echo "deb https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64 /" | tee /etc/apt/sources.list.d/cuda.list
        sudo apt-get update
        sudo apt-get -y install nvidia-fabricmanager-${driver_version_main}=${driver_version}-*
      • [インストールパッケージ]

        • Ubuntu 16.04

          driver_version=460.91.03
          driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
          sudo wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
          sudo dpkg -i nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
        • Ubuntu 18.04

          driver_version=460.91.03
          driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
          sudo wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
          sudo dpkg -i nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
        • Ubuntu 20.04

          driver_version=460.91.03
          driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
          sudo wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
          sudo dpkg -i nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
        • Ubuntu 22.04

          driver_version=535.154.05 
          driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
          sudo wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
          sudo dpkg -i nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
        • Ubuntu 24.04

          driver_version=570.133.20 
          driver_version_main=$(echo $driver_version | awk -F '.' '{print $1}')
          sudo wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
          sudo dpkg -i nvidia-fabricmanager-${driver_version_main}_${driver_version}-1_amd64.deb
    2. 次のコマンドを実行して、nvidia-fabricmanager サービスを開始します。

      sudo systemctl enable nvidia-fabricmanager
      sudo systemctl start nvidia-fabricmanager
    3. 次のコマンドを実行して、nvidia-fabricmanager サービスのステータスを確認します。

      systemctl status nvidia-fabricmanager

      次のような出力が表示されたら、nvidia-fabricmanager サービスは実行中です。

      nvidia-fabricmanager.service - NVIDIA fabric manager service
         Loaded: loaded (/lib/systemd/system/nvidia-fabricmanager.service; enabled; vendor preset: enabled)
         Active: active (running) since Mon 2021-09-13 19:14:45 CST; 1 weeks 1 days ago
        Process: 1928 ExecStart=/usr/bin/nv-fabricmanager -c /usr/share/nvidia/nvswitch/fabricmanager.cfg (code=exited, status=0/SUCCESS)
       Main PID: 2140 (nv-fabricmanage)
          Tasks: 18 (limit: 19660)
         CGroup: /system.slice/nvidia-fabricmanager.service
                 └─2140 /usr/bin/nv-fabricmanager -c /usr/share/nvidia/nvswitch/fabricmanager.cfg
      Sep 13 19:14:26 xxx systemd[1]: Starting NVIDIA fabric manager service...
      Sep 13 19:14:45 xxx nv-fabricmanager[2140]: Successfully configured all the available GPUs and NVSwitches.
      Sep 13 19:14:45 xxx systemd[1]: Started NVIDIA fabric manager service.
      説明

      GPU が正しく動作するためには、nvidia-fabricmanager パッケージのバージョンが Tesla ドライバーのバージョンと一致している必要があります。Ubuntu で、インストールパッケージを使用して nvidia-fabricmanager サービスをインストールした場合、apt-daily サービスが nvidia-fabricmanager パッケージを自動的に更新する可能性があります。これにより、Tesla ドライバーとのバージョン不一致が発生し、nvidia-fabricmanager サービスが起動しなくなり、GPU が使用できなくなることがあります。この問題を解決するには、「nvidia-fabricmanager のバージョンが Tesla ドライバーのバージョンと異なるため、GPU が期待どおりに動作しない」をご参照ください。

関連ドキュメント