大規模言語モデル (LLM) は、独自のナレッジベースに直接アクセスしたり、リアルタイムの動的な情報を取得したりすることはできません。このボトルネックに対処するため、Alibaba Cloud Model Studio (Model Studio) はエージェントアプリケーションを提供します。エージェントを使用すると、コードを記述することなく LLM を外部ツールと統合でき、モデルの機能を拡張できます。
コンソールの制限: 2025 年 4 月 21 日より前にアプリケーションを作成した国際サイトのユーザーのみが、次の図に示すように [アプリケーション開発] タブにアクセスできます。
このタブには、アプリケーション (エージェントアプリケーションおよびワークフローアプリケーション)、コンポーネント (プロンプトエンジニアリングおよびプラグイン)、およびデータ (ナレッジベースおよびアプリケーションデータ) の機能が含まれています。これらはすべてプレビュー機能です。本番環境での使用にはご注意ください。

API 呼び出しの制限: 2025 年 4 月 21 日より前にアプリケーションを作成した国際サイトのユーザーのみが、アプリケーションデータ、ナレッジベース、およびプロンプトエンジニアリングの API を呼び出すことができます。
基本原則
エージェントはプロンプトによって駆動され、複数の外部機能を調整することで複雑なタスクを完了します。リクエストを受け取ると、LLM は意図認識とタスク計画を実行します。その後、自律的に判断し、1 つまたは複数の外部機能を呼び出してタスクを実行します。最後に、情報を統合して応答を生成します。
Model Studio のエージェントは、次のコア機能をサポートしています:
ナレッジベース:外部のナレッジベースに接続します。これにより、アプリケーションは非公開データに基づいて質問に回答でき、LLM が特定の情報にアクセスできないという問題を解決します。
プラグイン:コード実行、画像生成、天気予報などの、プラットフォームに組み込まれた効率化ツールを呼び出します。
クイックスタート
基本的なエージェントの作成
Model Studio コンソールの [マイアプリケーション] ページに移動します。[+ アプリケーションの作成] をクリックします。[エージェントアプリケーション] タブで、[今すぐ作成] をクリックします。

アプリケーション設定ページで、モデル選択のドロップダウンメニューから
Qwen-Plusなどのモデルを選択します。特定の要件がない場合は、他のパラメーターはデフォルト設定のままにすることができます。
アプリケーションが作成されたら、左側のダイアログボックスに
Helloと入力してテストします。
エージェントの機能
Alibaba Cloud Model Studio のエージェントアプリケーションは、モデルの選択、システムプロンプトの最適化、検索拡張生成 (RAG) の追加、プラグインによって拡張できます。
モデル
モデルは、エージェントに思考、推論、意思決定を行わせるコアです。Model Studio のエージェントは、Qwen モデルをサポートしています。
モデルの選択
モデル選択のドロップダウンメニューから、
Qwen-Plusなどのモデルを選択します。
[その他のモデル] をクリックして、他のモデルを選択します。

パラメーターの設定
モデルのドロップダウンリストの右側にある
をクリックして、パラメーターを選択および設定します。サポートされているパラメーターは次のとおりです:最大応答長:プロンプトを除いた、モデルの生成の長さ制限。最大許容長はモデルによって異なります。
コンテキストターン数:モデルに入力する過去の会話の最大ターン数を設定します。ターン数が多いほど、会話の関連性が強くなります。
温度 (temperature):生成のランダム性と多様性を制御します。値が高いほど多様性が増し、低いほど一貫性が高まります。値の範囲は [0, 2) です。
enable_thinking:思考モードを有効にするかどうかを指定します。思考モードをサポートしていない一部のモデルでは、enable_thinking パラメーターを設定できません。
思考モードを有効にすると、モデルは応答を生成する際により多くの内部推論とコンテキスト処理を実行するため、トークンの消費量が増加します。
システムプロンプト
システムプロンプトは、エージェントにプリセットされたメタ命令です。エージェントのロール、行動規範、および機能の境界を定義し、対話中の一貫性、制御可能性、およびタスクの遵守を保証します。

プロンプトの設定
システムプロンプトを
『百年の孤独』のスタイルで私の質問に答えてくださいに設定します。以下は結果の比較です:システムプロンプトなし:

システムプロンプトの設定

ナレッジベース
検索拡張生成 (RAG) を使用すると、エージェントは外部のナレッジベースをクエリし、取得した最も関連性の高い情報を回答生成の直接的な根拠として使用できます。非公開のナレッジや専門分野の Q&A を扱う場合、RAG はエージェントの回答の精度を大幅に向上させ、ハルシネーションを削減できます。詳細については、「ナレッジベース (RAG)」をご参照ください。
RAG によって取得されたテキストも大規模言語モデルのコンテキストウィンドウを占有します。そのため、コンテキストウィンドウを最大限に活用し、その制限を超えないように、必要に応じて取得戦略とテキストの長さを調整する必要があります。
プラグイン
プラグインを呼び出すことで、エージェントアプリケーションはコード実行、Web 検索、テキストから画像への生成などの特定のタスクを実行できます。Model Studio は、さまざまな公式プラグインを提供し、カスタムプラグインの追加もサポートしています。詳細については、「プラグインの概要」をご参照ください。

エージェントの対話
テキスト対話
テキスト対話は、エージェントアプリケーションのコアとなる対話方法であり、インテリジェントでパーソナライズされたマルチターン対話体験を提供します。
テキスト対話は、主に 2 つの入力方法をサポートしています:
テキスト入力: テキストを入力してエージェントと対話します。
ファイルアップロード: ファイルを添付ファイルとしてエージェントにアップロードします。ドキュメント、画像、ビデオ、音声など、さまざまなフォーマットがサポートされています。

エージェントの公開と呼び出し
Model Studio のエージェントは、API を介した外部からの呼び出しをサポートしています。また、ワンクリックでサードパーティプラットフォームに公開したり、コンポーネントを介して他のビジネスプロセスに統合したりすることもサポートしています。
アプリケーションの公開
アプリケーションの公開は、その後のすべてのエージェントアプリケーションの呼び出しと統合の前提条件です。
エージェントアプリケーション管理ページの右上隅にある [公開] ボタンをクリックし、次に [公開の確認] をクリックしてアプリケーションの公開を完了します。
アプリケーションが初めて公開されるのではない場合、ポップアップウィンドウに前回の公開以降の変更点が表示されます。
アプリケーションが RAM アカウントによって作成された場合は、公開する前にサービスリンクロールの権限 ram:CreateServiceLinkedRole があることを確認してください。詳細については、「サービスリンクロール」をご参照ください。
API による呼び出し
エージェントアプリケーションの [公開チャンネル] タブで、[API 呼び出し] の右側にある [API の表示] をクリックすると、API を介してエージェントアプリケーションを呼び出す方法が表示されます。
YOUR_API_KEY をご利用の Model Studio API キーに置き換えて API を呼び出してください。

エージェント管理
削除とコピー
[アプリケーション管理] で公開されたアプリケーションカードを見つけることができます。 メニューで、エージェントの削除またはコピー、あるいはアプリケーション名の変更ができます。

バージョン管理
バージョン管理機能を通じて、過去のバージョンの説明を編集したり、以前に公開された過去のバージョンを選択して使用したりできます。
エージェントアプリケーションの [アプリケーション設定] タブで、上部ナビゲーションバーの右上隅にある [バージョン管理] をクリックします。

過去のバージョンのリストで、対象のバージョンを選択します:

バージョン情報を変更するには、
アイコンにマウスを合わせてクリックします。[バージョン説明の編集] ダイアログボックスで、必要に応じて変更を加え、[OK] をクリックします。この過去のバージョンを使用するには、[現在のドラフトを上書き] をクリックし、確認ダイアログボックスで [確認] をクリックします。
この過去のバージョンの内容が現在のドラフトの内容を上書きします。
課金
エージェント機能の課金には、主に次の側面が含まれます:
モデルの呼び出し
エージェントはモデルの呼び出し料金が発生します。具体的な料金は、モデルの種類と入出力トークンの数によって異なります。
特定のモデルの種類と対応する課金ルールについては、「モデル」をご参照ください。
ナレッジベース
ナレッジベース機能は期間限定で無料です。
ナレッジベースから取得されたテキストセグメントは、モデルの入力トークン数を増加させ、モデル推論 (呼び出し) 料金の増加につながる可能性があります。詳細については、「ナレッジベースの課金」をご参照ください。
サポートされているモデル
データの更新が遅れる場合があります。サポートされているモデルのリストは、エージェントアプリケーション内に表示されるものが最新です。