Alibaba Cloud Platform for AI (PAI) は、中国における NVIDIA の認定 NIM パートナーです。
NIM は、NVIDIA によって導入された使いやすい事前構築済みコンテナー ツールのセットであり、企業顧客がクラウド、データセンター、およびワークステーションに高性能 AI モデルを安全かつ確実にデプロイできるようにすることを目的としています。 NIM モデルは、NIM 最適化ツールによって処理されたパフォーマンス最適化モデルであり、元のオープンソース モデルと比較して推論パフォーマンスが大幅に向上しています。
PAI のモデルギャラリーは、複数の NIM モデルを提供しています。 NIM モデルを取得するには、モデルギャラリーの左側のフィルター ペインで NIMモデルソース に を選択します。次のいずれかの方法を使用して NIM モデルをデプロイできます。
サポートされている NIM モデル
次の表は、PAI のモデルギャラリーにデプロイできる NIM モデルについて説明しています。
モデル名 | モデルギャラリーのモデル ページ | NIM モデル推論最適化でサポートされているモデル タイプ |
qwen2.5-7b-instruct-NIM | ecs.gn7e ecs.gn8is | |
MolMIM | 汎用 GPU | |
Earth-2 FourCastNet | 汎用 GPU | |
NVIDIA Retrieval QA Mistral 7B Embedding v2 | ecs.gn7e エディション | |
Eye Contact | 汎用 GPU | |
NV-CLIP |
| |
AlphaFold2-Multimer | 汎用 GPU | |
Snowflake Arctic Embed Large Embedding |
| |
NVIDIA Retrieval QA Mistral 4B Reranking v3 |
| |
NVIDIA Retrieval QA E5 Embedding v5 |
| |
Parakeet CTC Riva 1.1b | 汎用 GPU | |
FastPitch HifiGAN Riva | 汎用 GPU | |
VISTA-3D | 汎用 GPU | |
AlphaFold2 | 汎用 GPU | |
ProteinMPNN | 汎用 GPU | |
megatron-1b-nmt | 汎用 GPU |
PAI のモデルギャラリーにモデルをデプロイする
モデルギャラリー に移動します。
左側のフィルター ペインで、[モデルソース] に [NIM] を選択して、NIM モデルを検索します。

管理するモデルを見つけて、モデルカードをクリックします。 [概要] タブの右上隅にある [デプロイ] をクリックします。
説明PAI に NIM モデルをデプロイする前に、NVIDIA Al Enterprise ユーザーまたは NVIDIA Developer Program ユーザーであることを確認してください。

[デプロイ] パネルで、リソースを設定し、[デプロイ] をクリックします。デプロイされたモデル サービスの呼び出し方法については、モデル詳細ページの [概要] タブの説明を参照してください。

オンプレミス マシンにモデルをデプロイする
NIM モデルのイメージ ファイルとモデル ファイルをダウンロードし、オンプレミス マシンにモデルをデプロイできます。 PAI に NIM モデルをデプロイする前に、NVIDIA Al Enterprise ユーザーまたは NVIDIA Developer Program ユーザーであることを確認してください。
環境を設定します。 詳細については、「はじめに」をご参照ください。
モデル詳細ページの [概要] タブで、[リソースのダウンロード] をクリックします。表示されるダイアログ ボックスで、ダウンロード文を選択し、[OK] をクリックして、イメージ URL とモデル URL を取得します。
次のコマンドを実行して、イメージをプルします。(${Image URL} を実際のイメージ URL に置き換えます。)
docker pull ${Image URL}Alibaba Cloud ツール ossutil を使用してモデル ファイルをダウンロードします。
次のコマンドを実行して、コンテナーを起動します。(この例では、/local/model/ ディレクトリが使用されています。 ${Model URL} を実際のモデル URL に置き換え、${Image URL} を実際のイメージ URL に置き換えます。)
docker run --rm \ --runtime=nvidia \ --gpus all \ -u $(id -u) \ -v /local/model/:${Model URL} ${Image URL}
付録: PAI を使用するためのアクティベーション プロセス
Alibaba Cloud を初めて使用するユーザー向けに、PAI のモデルギャラリーを使用するための初期設定プロセスを以下に概説します。
Alibaba Cloud にアクセスし、右上隅の [サインアップ] をクリックして、アカウントとパスワードを入力するか、新しいユーザーを登録します。

ログインと実名登録の後、Platform for AI (PAI) にアクセスします。
PAI を初めて使用する場合は、実名登録と承認を完了する必要があります。すべてのオプションのデフォルト設定を保持し、[アクティベート] をクリックします。数秒後、PAI がアクティベートされます。その後、デプロイと使用のためにデフォルト ワークスペースにアクセスできます。
