Hologres は、多様な AI アプリケーション向けにさまざまな組み込み AI モデルを提供しています。ビジネスニーズに基づいて、Hologres コンソールからこれらのモデルをデプロイできます。このドキュメントでは、利用可能な AI モデルとそれらをデプロイする方法について説明します。
サポートされているモデル
これらの組み込みモデルには、Hologres V3.2 以降のバージョンが必要です。
モデル名 | カテゴリ | 単一レプリカデプロイメントに推奨される最小 vCPU 数 | 単一レプリカデプロイメントに推奨される最小メモリ (GB) | 単一レプリカデプロイメントに推奨される最小 GPU 数 | 単一レプリカデプロイメントに推奨される最小 GPU メモリ (GB) | 必要なインスタンスバージョン | 注 |
PDF 変換モデル | 20 | 100 | 1 以上 | 48 | V4.0 以降 | なし | |
マルチモーダルモデル | 7 | 24 | 1 以上 | 24 | V4.0 以降 | なし | |
マルチモーダルモデル | 7 | 30 | 1 以上 | 48 | V4.0 以降 | なし | |
マルチモーダルモデル | 7 | 30 | 1 以上 | 96 | V4.0 以降 | なし | |
画像埋め込みモデル | 7 | 24 | 1 | 24 | V4.0 以降 |
| |
画像用の多言語埋め込みモデル | 7 | 24 | 1 | 24 | V4.0 以降 |
| |
画像埋め込みモデル | 7 | 24 | 1 | 24 | V4.0 以降 |
| |
画像埋め込みモデル | 7 | 24 | 1 | 24 | V4.0 以降 |
| |
LLM | 7 | 30 | 1 以上 | 8 | V3.2 以降 | なし | |
LLM | 7 | 30 | 1 以上 | 16 | V3.2 以降 | なし | |
LLM | 7 | 30 | 1 以上 | 32 | V3.2 以降 | なし | |
LLM | 7 | 30 | 1 以上 | 48 | V3.2 以降 | なし | |
LLM | 7 | 30 | 1 以上 | 96 | V3.2 以降 | なし | |
感情分類 | 7 | 30 | 1 | 4 | V3.2 以降 | なし | |
テキスト埋め込みモデル | 7 | 30 | 1 | 12 | V3.2 以降 | 出力ベクターディメンション: 768 | |
テキスト埋め込みモデル | 7 | 30 | 1 | 16 | V3.2 以降 | 出力ベクターディメンション: 1024 | |
テキスト埋め込みモデル | 7 | 30 | 1 | 8 | V3.2 以降 | 出力ベクターディメンション: 512 | |
テキスト埋め込みモデル | 7 | 30 | 1 | 8 | V3.2 以降 | なし | |
テキスト埋め込みモデル | 7 | 30 | 1 | 32 | V3.2 以降 | なし | |
テキスト埋め込みモデル | 7 | 30 | 1 | 48 | V3.2 以降 | なし | |
recursive-character-text-splitter | テキストチャンキング | 15 | 30 | 0 | 0 | V3.2 以降 | 必要に応じて CPU 仕様を選択します。GPU 数の設定は不要です。 |
長文テキスト埋め込み | 7 | 30 | 1 | 12 | V3.2 以降 | 出力ベクターディメンション: 768 | |
長文テキスト埋め込み | 7 | 30 | 1 | 12 | V3.2 以降 | 出力ベクターディメンション: 768 | |
長文テキスト埋め込み | 7 | 30 | 1 | 16 | V3.2 以降 | 出力ベクターディメンション: 1024 | |
長文テキスト埋め込み | 7 | 30 | 1 | 16 | V3.2 以降 | 出力ベクターディメンション: 1024 | |
長文テキスト埋め込み | 7 | 30 | 1 | 8 | V3.2 以降 | 出力ベクターディメンション: 384 | |
長文テキスト埋め込み | 7 | 30 | 1 | 8 | V3.2 以降 | 出力ベクターディメンション: 512 |
前提条件
AI リソースを購入済みです。
注
上記のリストからモデルを選択してデプロイします。各モデルには、指定された最小 AI リソースが必要です。
購入したクォータを超えない限り、1 つのインスタンスに複数のモデルをデプロイできます。リソースが不足している場合は、スケールアップしてください。
プライマリ/セカンダリインスタンスの場合: モデルのデプロイメントと管理 (リソースの変更、削除) はプライマリインスタンス専用です。セカンダリインスタンスは、プライマリインスタンスのモデルを表示し、AI 関数を介して呼び出すことができます。
モデルのデプロイ
Hologres コンソールにログオンし、リージョンを選択します。
左側のナビゲーションメニューで、[インスタンス] をクリックします。次に、ターゲットインスタンス ID をクリックします。
[インスタンス詳細] ページで、[AI ノード] をクリックします。
[モデル] セクションで、[モデルのデプロイ] をクリックします。
[モデルのデプロイ] ダイアログボックスで、[モデル名] と [モデルタイプ] を設定します。
[リソース構成] のパラメーターは、選択した [モデルタイプ] に基づいて自動的に入力されます。
構成が完了したら、[OK] をクリックしてモデルをデプロイします。
[モデル] セクションで、デプロイメントステータスを表示し、次の操作を実行します:
モデル構成の調整: ターゲットモデルの [アクション] 列で、[構成の調整] をクリックします。
モデルの削除: ターゲットモデルの [アクション] 列で、[削除] をクリックします。
説明Hologres は、モデルを削除する際に依存サービスをチェックしません。サービスのダウンタイムを防ぐために、細心の注意を払ってください。
次のステップ
モデルをデプロイした後、AI 関数を介して呼び出すことができます。詳細については、「AI 関数」をご参照ください。