すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:NIM モデルの使用ガイド

最終更新日:May 15, 2025

Alibaba Cloud Platform for AI (PAI) は、中国における NVIDIA の認定 NIM パートナーです。

NIM は、NVIDIA によって導入された使いやすい事前構築済みコンテナー ツールのセットであり、企業顧客がクラウド、データセンター、およびワークステーションに高性能 AI モデルを安全かつ確実にデプロイできるようにすることを目的としています。 NIM モデルは、NIM 最適化ツールによって処理されたパフォーマンス最適化モデルであり、元のオープンソース モデルと比較して推論パフォーマンスが大幅に向上しています。

PAI のモデルギャラリーは、複数の NIM モデルを提供しています。 NIM モデルを取得するには、モデルギャラリーの左側のフィルター ペインで NIMモデルソース に を選択します。次のいずれかの方法を使用して NIM モデルをデプロイできます。

サポートされている NIM モデル

次の表は、PAI のモデルギャラリーにデプロイできる NIM モデルについて説明しています。

モデル名

モデルギャラリーのモデル ページ

NIM モデル推論最適化でサポートされているモデル タイプ

qwen2.5-7b-instruct-NIM

qwen2.5-7b-instruct-NIM

ecs.gn7e

ecs.gn8is

MolMIM

MolMIM

汎用 GPU

Earth-2 FourCastNet

FourCastNet

汎用 GPU

NVIDIA Retrieval QA Mistral 7B Embedding v2

NV-EmbedQA-Mistral-7b-v2

ecs.gn7e エディション

Eye Contact

eyecontact

汎用 GPU

NV-CLIP

nvclip

  • ecs.gn7e エディション

  • ecs.gn7i エディション

AlphaFold2-Multimer

AlphaFold2-Multimer

汎用 GPU

Snowflake Arctic Embed Large Embedding

Arctic-embed-l

  • ecs.gn7e エディション

  • ecs.gn7i エディション

NVIDIA Retrieval QA Mistral 4B Reranking v3

NV-RerankQA-Mistral-4B-v3

  • ecs.gn7e エディション

  • ecs.gn7i エディション

NVIDIA Retrieval QA E5 Embedding v5

NV-EmbedQA-E5-v5

  • ecs.gn7e エディション

  • ecs.gn7i エディション

Parakeet CTC Riva 1.1b

Parakeet-CTC-1.1b-asr

汎用 GPU

FastPitch HifiGAN Riva

FastPitchHifi-GAN

汎用 GPU

VISTA-3D

Vista-3D

汎用 GPU

AlphaFold2

AlphaFold2

汎用 GPU

ProteinMPNN

ProteinMPNN

汎用 GPU

megatron-1b-nmt

megatron-1b-nmt

汎用 GPU

PAI のモデルギャラリーにモデルをデプロイする

  1. モデルギャラリー に移動します。

  2. 左側のフィルター ペインで、[モデルソース][NIM] を選択して、NIM モデルを検索します。

    image.png

  3. 管理するモデルを見つけて、モデルカードをクリックします。 [概要] タブの右上隅にある [デプロイ] をクリックします。

    説明

    PAI に NIM モデルをデプロイする前に、NVIDIA Al Enterprise ユーザーまたは NVIDIA Developer Program ユーザーであることを確認してください。

    image.png

  4. [デプロイ] パネルで、リソースを設定し、[デプロイ] をクリックします。デプロイされたモデル サービスの呼び出し方法については、モデル詳細ページの [概要] タブの説明を参照してください。

    image.png

オンプレミス マシンにモデルをデプロイする

NIM モデルのイメージ ファイルとモデル ファイルをダウンロードし、オンプレミス マシンにモデルをデプロイできます。 PAI に NIM モデルをデプロイする前に、NVIDIA Al Enterprise ユーザーまたは NVIDIA Developer Program ユーザーであることを確認してください。

  1. 環境を設定します。 詳細については、「はじめに」をご参照ください。

  2. モデル詳細ページの [概要] タブで、[リソースのダウンロード] をクリックします。表示されるダイアログ ボックスで、ダウンロード文を選択し、[OK] をクリックして、イメージ URL とモデル URL を取得します。

  3. 次のコマンドを実行して、イメージをプルします。(${Image URL} を実際のイメージ URL に置き換えます。)

    docker pull ${Image URL}
  4. Alibaba Cloud ツール ossutil を使用してモデル ファイルをダウンロードします。

  5. 次のコマンドを実行して、コンテナーを起動します。(この例では、/local/model/ ディレクトリが使用されています。 ${Model URL} を実際のモデル URL に置き換え、${Image URL} を実際のイメージ URL に置き換えます。)

    docker run --rm \
    --runtime=nvidia \
    --gpus all \
    -u $(id -u) \
    -v /local/model/:${Model URL} ${Image URL}

付録: PAI を使用するためのアクティベーション プロセス

Alibaba Cloud を初めて使用するユーザー向けに、PAI のモデルギャラリーを使用するための初期設定プロセスを以下に概説します。

  1. Alibaba Cloud にアクセスし、右上隅の [サインアップ] をクリックして、アカウントとパスワードを入力するか、新しいユーザーを登録します。

    image.png

  2. ログインと実名登録の後、Platform for AI (PAI) にアクセスします。

    PAI を初めて使用する場合は、実名登録と承認を完了する必要があります。すべてのオプションのデフォルト設定を保持し、[アクティベート] をクリックします。数秒後、PAI がアクティベートされます。その後、デプロイと使用のためにデフォルト ワークスペースにアクセスできます。

    image.png