すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:ナレッジベース

最終更新日:Nov 25, 2025

大規模言語モデル (LLM) はプライベートな知識に欠けており、その一般的な知識は古い可能性があります。業界では一般的に、ユーザーの入力に基づいて外部ソースから関連情報を取得するために、取得拡張生成 (RAG) 技術が使用されています。この取得されたコンテンツは、ユーザーのクエリと組み合わされて LLM に提供され、より正確な回答を生成します。Model Studio の RAG 機能であるナレッジベース機能は、プライベートな知識を効果的に補完し、最新の情報を提供します。

重要

専用ナレッジベースのないアプリケーション

専用のナレッジベースがないと、LLM は特定のドメインに関する質問に正確に回答できません。

无

専用ナレッジベースのあるアプリケーション

専用のナレッジベースを使用すると、LLM は特定のドメインに関する質問に正確に回答できます。

有

モデルの可用性

ナレッジベースは、以下のモデルで使用できます。Qwen ナレッジベースの設定

  • Qwen-Max/Plus/Turbo

  • QwenVL-Max/Plus

  • Qwen (Qwen2.5 など)

上記のリストは随時更新される可能性があります。最新のリストについては、アプリケーション作成時に [マイアプリケーション] ページで利用可能なモデルをご参照ください。

開始方法

このセクションでは、コードを一切記述せずに、特定のドメイン (この場合は架空の「Bailian phone」) に関する質問に回答できる LLM Q&A アプリケーションを構築する方法について説明します。

1. ナレッジベースの構築

  1. ナレッジベース ページに移動し、[ナレッジベースの作成] をクリックします。[名前] を入力し、他の設定はデフォルト値のままにして、[次のステップ] をクリックします。

  2. [デフォルトカテゴリ] を選択し、Bailian Phones Specifications.docx ファイルをアップロードします。[次のステップ] をクリックし、次に [インポート] をクリックします。

2. ビジネスアプリケーションとの統合

ナレッジベースを作成した後、それを特定のアプリケーション (ナレッジベースと同じワークスペースにある必要があります) または外部アプリケーションに関連付けて、取得リクエストを処理できます。

エージェントアプリケーションとの統合

  1. [マイアプリケーション] ページに移動し、ターゲットのエージェントアプリケーションを見つけて、そのカードの [構成] をクリックします。次に、アプリケーションのモデルを選択します。

    image

  2. [ドキュメント] の右側にある [+] ボタンをクリックして、前のステップで作成したナレッジベースを追加します。類似度のしきい値と重みはデフォルト値のままにすることができます。

    (オプション) 類似度のしきい値: 取得結果のフィルタリング

    ナレッジベースは、セマンティック検索を使用して、キーワードが完全に異なっていても、クエリの意図に関連するプライベートデータまたはファイル内のテキストを検索します。

    たとえば、ユーザーは次のようにクエリします: 写真撮影に適した Bailian phone はどれですか?

    ただし、実際の回答 (Qwen Vivid 7...) には、ユーザーのクエリのキーワードは含まれていません。

    以下の表のキーワード類似度は Jaccard インデックス に基づいて計算され、セマンティック類似度は text-embedding-v4コサイン類似度

    取得されたテキスト

    キーワード類似度

    セマンティック類似度

    Qwen Vivid 7: スマート写真の新しい体験

    0

    0.43

    Bailian Ace Ultra: ゲーマーのための選択肢

    0.17

    0.32

    Bailian Flex Fold+: 折りたたみ式スクリーンの新時代

    0.25

    0.24

    類似度のしきい値: この値よりもセマンティック類似度スコアが高いテキストのみが取得されます。この値が高すぎると、ナレッジベースは関連するすべてのテキストを破棄します。

    (オプション) 重み: 複数のナレッジベースの取得順序に影響

    エージェントアプリケーションが複数のナレッジベースに関連付けられている場合、情報ソースの重要度に基づいて各ナレッジベースに重みを割り当てることができます。マルチチャネルリコール中に、複数のナレッジベースに関連するテキストセグメントが含まれている場合、システムはより高い重みを持つナレッジベースのテキストセグメントを優先します

    • 主な制限: 重みは同じタイプのナレッジベース間でのみ有効です。たとえば、ドキュメント検索ナレッジベースの重みは、データクエリナレッジベースの取得順序には影響しません。逆も同様です。

    • 仕組み: システムはまず、ユーザーの質問と各ナレッジベースのコンテンツとの関連性を計算し、最も関連性の高いテキストセグメントをフィルタリングします。次に、各テキストセグメントの類似度スコアに、対応するナレッジベースの重みを掛け合わせます。これらの重み付けされたスコアに基づいて結果を再ランク付けした後、システムはそれらを LLM に提供して、回答を生成する際に参照させます。重み付けされたスコアが高いセグメントほど、使用される可能性が高くなります。

  3. 右側の入力ボックスで質問をします。LLM は、作成したナレッジベースを使用して回答を生成します。

    例: 「3,000 元未満で写真撮影に最適な Bailian phone を選ぶのを手伝ってください。」

ワークフローアプリケーションとの統合

  1. [マイアプリケーション] ページに移動し、ターゲットのワークフローアプリケーションを見つけて、そのカードの [構成] をクリックします。次に、[ナレッジベース] ノードをキャンバスにドラッグし、[開始] ノードの後に接続します。

  2. ナレッジベースノードを構成します:

    1. 入力: 変数名 content の右側にある [値] ドロップダウンリストで、[組み込み変数] > [クエリ] を選択します。

    2. ナレッジベースの選択: 前のステップで作成したナレッジベースを選択します。

    3. [topK] の設定 (オプション): これは、子孫ノード (通常は LLM ノード) に返されるナレッジセグメントの数を決定します。

      この値を増やすと、通常、LLM の回答の精度が向上しますが、LLM が消費する入力トークンの数も増加します。
  3. [LLM] ノードをキャンバスにドラッグし、ナレッジベースノードの後、[終了] ノードの前に接続します。

  4. LLM ノードを構成します:

    1. [モデル設定] リストで、ノードのモデルを選択します。

    2. [プロンプト] フィールドに、LLM にナレッジベースを使用するように指示するプロンプトを入力します。/ を入力して result 変数を挿入する必要があります。これは、ナレッジベースの取得によって返された結果を表します。

      image

  5. 終了ノードを構成します: / を入力し、[LLM 1] > [結果] を選択して、LLM によって返された結果を出力します。

  6. ページの右上隅にある [テスト] をクリックします。次に、右側の入力ボックスで質問をします。LLM は、作成したナレッジベースを使用して回答を生成します。

    例: 「3,000 元未満で写真撮影に最適な Bailian phone を選ぶのを手伝ってください。」

外部アプリケーションとの統合

Model Studio でアプリケーションを構築するだけでなく、独立した RAG サービスとしてナレッジベースの取得機能を使用することもできます。GenAI Service Platform SDK を使用すると、このサービスを外部の AI アプリケーションに迅速に統合できます。

詳細な統合手順については、「ナレッジベース API ガイド」をご参照ください。

3. ナレッジベースの最適化 (オプション)

ナレッジの取得が不完全であったり、Q&A プロセス中にコンテンツが不正確であったりする場合は、「ナレッジベースのパフォーマンスを最適化する」をご参照ください。

ユーザーガイド

[ナレッジベース] ページでは、現在のワークスペース内のすべてのナレッジベースを表示および管理できます。

ナレッジベース ID: 各ナレッジベースカードの ID フィールドの値。API 呼び出しやその他のシナリオで使用されます。

ナレッジベースの作成

  1. [ナレッジベース] ページで、[ナレッジベースの作成] をクリックします。

  2. アプリケーションシナリオに基づいて、適切な [ナレッジベースタイプ] を選択します。1 つのナレッジベースでサポートできるタイプは 1 つだけです。作成後にナレッジベースタイプを変更することはできません。

    • ドキュメント検索 (取得シナリオ用)

      • シナリオ:

      • データソースの統合: ローカルファイルをアップロードするか、Alibaba Cloud Object Storage Service (OSS) からインポートできます。

        作成手順 (ドキュメント検索)

        1. データの選択: ナレッジベースのデータソース (ファイルまたはコンテンツを含む) を指定します。データソースのコンテンツは、後続の取得のためにナレッジベースにインポートされます。[ローカルアップロード][クラウドインポート] (既存のカテゴリまたはファイルを選択) の 2 つの方法がサポートされています。

          • ローカルアップロード: コンピューターから直接ファイルをアップロードします。解析方法の選択方法については、以下の折りたたみ可能なパネルを展開してください。

            データ解析設定

            要件に基づいて解析ポリシーを構成します。どちらを選択すればよいかわからない場合は、デフォルト設定のままにすることができます。

            • デジタル解析: ファイル内のイラストやチャートの解析をサポートしていません。

            • インテリジェント解析: ファイル内のイラストの場合、パーサーは画像からテキストを識別して抽出し、テキストの要約を生成します。これらの要約は、ファイル内の他の非画像コンテンツとともにチャンク化され、埋め込みに変換され、ナレッジベースの取得に使用されます。

            • LLM 解析: Qwen-VL モデルを備えたエージェントアプリケーションを使用する場合、ファイル内のイラストやチャートのコンテンツについて質問できます。ファイル内のイラストやチャートの認識と理解を有効にするには、[LLM 解析] を選択します。

            • Qwen VL 解析: この方法は画像ファイル専用です。Qwen-VL モデルを指定し、プロンプトを提供して、画像レイアウトと要素の認識と抽出をガイドできます。

            image

            image

          • クラウドインポート: アプリケーションデータまたは Object Storage Service (OSS) から既存のファイルをインポートします。詳細な手順については、「データインポート」をご参照ください。

        2. インデックス構成: インポートされたデータの処理方法と保存方法を定義します。これは取得パフォーマンスに直接影響します。

          以下の設定項目のうち、ADB-PG を選択した場合に料金が発生する可能性があるのは「ベクトルストレージ」のみです。他のすべての構成は無料です。

          メタデータ抽出

          メタデータは、非構造化データに関連する追加のプロパティのセットです。これらのプロパティは、キーと値のペアとしてテキストセグメントに統合されます。

          • 目的: メタデータは、テキストセグメントに重要なコンテキスト情報を提供し、ナレッジベースの取得精度を大幅に向上させることができます。たとえば、ファイル名が製品名である何千もの製品紹介ファイルを含むナレッジベースを想像してください。ユーザーが「製品 A の機能概要」を検索した場合、すべてのファイルの本文に「機能概要」が含まれているが「製品 A」については言及されていない場合、ナレッジベースは多くの無関係なテキストセグメントを取得する可能性があります。ただし、製品名がすべてのテキストセグメントにメタデータとして追加されている場合、ナレッジベースは「製品 A」に関連し、「機能概要」も含むテキストセグメントを正確にフィルタリングできます。これにより、取得精度が向上し、モデルが消費する入力トークンの数が削減されます。

          • 使用法: API を使用してアプリケーションを呼び出す場合、metadata_filter リクエストパラメーターで [メタデータ] を指定できます。ナレッジベースから取得する際、アプリケーションはまず [メタデータ] に基づいて関連ファイルをフィルタリングします。

          • 注意: ナレッジベースを作成した後、メタデータ抽出を構成することはできません

          メタデータの設定方法

          [メタデータ抽出] を有効にし、[設定] をクリックして、ナレッジベース内のすべてのファイルに統一されたメタデータまたはパーソナライズされたメタデータを追加します。チャンク化中に、各ファイルのメタデータはそれぞれのテキストセグメントに統合されます。以下の図は、上記の例で使用されているメタ情報テンプレートを示しています:

          image

          メタ情報テンプレートの作成手順

          値の抽出方法:

          • 定数: ナレッジベース内のすべてのファイルに固定のプロパティを追加します。

            上記の例に示すように、ナレッジベース内のすべてのファイルに同じ作成者がいる場合、author という名前の定数フィールドを統一して設定できます。
          • 変数: ナレッジベース内の各ファイルに可変のプロパティを追加します。現在サポートされているプロパティには、file_namecat_name があります。file_name を選択すると、Model Studio はファイルのメタデータにファイルの名前を追加します (上記の例を参照)。cat_name を選択すると、Model Studio はファイルが配置されているカテゴリの名前をファイルのメタデータに追加します。

          • LLM: システムは、指定された [エンティティの説明] ルールに従って、ナレッジベース内の各ファイルのテキストコンテンツを照合します。システムは、ファイルから関連情報を自動的に識別して抽出し、この情報をファイルのメタデータにプロパティとして追加します。

            上記の例のメタ情報テンプレートに示すように、各ファイルで言及されているすべての年をファイルのプロパティとして抽出するには、date という名前の LLM フィールドを次のエンティティ説明構成で設定できます:

            image

          • 正規表現: システムは、指定された正規表現に従って、ナレッジベース内の各ファイルのテキストコンテンツを照合します。式に一致するコンテンツが抽出され、ファイルのメタデータにプロパティとして追加されます。

            上記の例のメタ情報テンプレートに示すように、各ファイルで言及されているすべての参照を抽出するには、参照が「で始まり」で終わるパターンに従うと仮定すると、reference という名前の正規表現フィールドを次の正規表現構成で設定できます:

            image

          • キーワード検索: システムは、各ファイルで事前に設定されたキーワードを検索し、見つかったキーワードをそのファイルのメタデータにプロパティとして追加します。

            たとえば、上記の例のメタ情報テンプレートでは、事前に設定されたキーワードは次のとおりです:

            image

            ただし、このファイルには「financing」、「industry」、「green」、「capital」というキーワードしか出現しなかったため、システムはこれらの 4 つのキーワードのみをファイルの keywords プロパティの値として抽出しました。

          取得に使用: 有効にすると、メタデータフィールドと値がテキストセグメントコンテンツとともにナレッジベースの取得に含まれます。無効にすると、テキストセグメントコンテンツのみが取得に使用されます。

          モデルの応答に使用: 有効にすると、メタデータフィールドと値がテキストセグメントコンテンツとともに LLM の応答生成プロセスに含まれます。無効にすると、テキストセグメントコンテンツのみが LLM の応答生成プロセスに使用されます。

          Excel ヘッダーのアセンブリ

          有効にすると、ナレッジベースはすべての XLSX および XLS 形式ファイルの最初の行をテーブルヘッダーとして扱い、各テキストセグメント (データ行) に自動的に追加します。これにより、LLM がヘッダーを通常のデータ行として誤って扱うのを防ぎます。

          ナレッジベースに PDF などの他の形式のファイルが含まれている場合、この設定を有効にする必要はありません。

          チャンク化メソッド

          [インテリジェント分割] (推奨) を選択します。

          目的: ナレッジベースはファイルをテキストセグメント (チャンク) に分割し、これらのチャンクをベクトルモデルを使用してベクトルに変換します。テキストセグメントとそれに対応するベクトルは、ベクトルデータベースにキーと値のペアとして保存されます。ナレッジベースを作成した後、各テキストセグメントの特定のコンテンツ (テキストと画像) を表示または編集できます。
          注意: ナレッジベースを作成した後、ドキュメントのチャンク化方法を変更することはできません。不適切なチャンク化ポリシーは、取得およびリコールのパフォーマンスを低下させる可能性があります。

          複数ラウンドの会話の書き換え

          この機能を有効にすると、システムは専用の軽量モデルを呼び出して、会話履歴を取り込むことでユーザーの現在の質問を独立した文脈的に完全な新しいクエリに書き換えます。この新しいクエリは、ナレッジベースの取得に使用されます。

          埋め込みモデル

          埋め込みモデルは、元の入力プロンプトとナレッジテキストを数値埋め込みに変換して、それらのセマンティック類似度を計算します。デフォルトモデル (変更不可) は、中国語と英語に加えて複数の言語をサポートし、結果のベクトルを正規化します。

          ナレッジベース内の異なるベクトルモデルによって生成されるベクトルディメンション:

          以下のベクトルディメンションは変更できません。
          • text-embedding-v2: 1,536 ディメンション

          再ランキングモデル

          再ランキングモデルは、ベクトル検索によって最初に取得された候補セグメントに対して二次的なランキングを実行し、類似度スコアが最も高い上位 K 個のテキストセグメントを返します。公式ランキングモデル (推奨) は、セマンティックな関連性とキーワードマッチングアルゴリズム (BM25 など) を組み合わせて、正確なキーワードヒットを必要とするクエリをより適切に処理します。セマンティックランキングのみが必要な場合は、GTE-ReRank モデルを選択します。

          類似度のしきい値

          このしきい値は、テキストセグメントが取得されるための最小類似度スコアを表します。再ランキングモデルによって返されるテキストセグメントをフィルタリングするために使用されます。この値を超えるスコアを持つテキストセグメントのみが取得されます。

          説明

          この設定は、ナレッジベースのデフォルトの類似度のしきい値です。ナレッジベースを特定のアプリケーションに関連付ける場合、そのアプリケーションに別のしきい値を設定することもでき、これはナレッジベースのデフォルトの類似度のしきい値をオーバーライドします。

          このしきい値を下げると、より多くのテキストセグメントが取得されることが期待されますが、関連性の低いセグメントが取得される可能性があります。このしきい値を上げると、取得されるテキストセグメントの数が減少します。高すぎると、ナレッジベースが関連するテキストセグメントを破棄する原因になります。

          ヒットテストを使用して、取得率と精度のバランスを取るために類似度のしきい値を微調整できます。

          最大再呼び出し回数

          アプリケーションが 3 つのナレッジベース A1、A2、A3 に関連付けられているとします。システムは、これらのベースからユーザーの入力に関連するセグメントを取得し、再ランキングモデルを使用してそれらを再ランク付けし、上位 K 個の最も関連性の高いセグメントを選択して、LLM に応答のコンテキストとして提供します。この値 K は、最大取得数 (最大 20) です。これは、再ランキングモデルが参照用に LLM に提供するテキストセグメントの数を決定します。

          この値を増やすと、LLM の応答の精度が向上する可能性がありますが、LLM が消費する入力トークンの数も増加します。

          ベクトルストレージ

          テキストベクトルを保存するベクトルデータベースを選択します。プラットフォームストレージベクトルデータベースは、ナレッジベースの基本的な機能要件には十分です。データベースの管理、監査、監視などの高度な機能については、選択 ADB-PG (AnalyticDB for PostgreSQL) をお勧めします。

          ADB-PG インスタンスを購入する際は、ベクトルエンジン最適化を有効にする必要があることに注意してください。そうしないと、Model Studio はこのインスタンスを使用できません。
    • データクエリ (チャットボットまたは NL2SQL シナリオ用)

      • シナリオ:

        • このタイプは、FAQ、製品データ、人事情報クエリアシスタントなど、構造化データ (事前に定義されたテーブルスキーマで整理されたデータ) に基づく Q&A システムの構築に適しています。

        • データが完全な FAQ Q&A ペアで構成されている場合は、[データクエリ] を選択します。たとえば、質問回答の 2 つの列を含む Excel ファイルがある場合、データクエリナレッジベースでは、質問列からのみ情報を取得し、回答列のコンテンツのみを LLM の応答の参照として使用できます。

          ドキュメント検索ナレッジベースでは、この効果を簡単に実現することはできません。
        • 完全に同一のテーブルスキーマを持つ複数の Excel ファイルをインポートできます。

      • データソースの統合: ローカルの XLS または XLSX ファイルをアップロードできます。

        作成手順 (データクエリ)

        1. データの選択: ファイルやコンテンツなどのデータソースを指定して、後続の取得のためにナレッジベースにインポートします。ローカルアップロードクラウドインポート (アプリケーションデータから既存のデータテーブルを選択) の 2 つの方法がサポートされています。

          説明

          ナレッジベースの作成後にデータソースを変更することはできず、1 つのナレッジベースで複数のデータソースを同時にサポートすることはできません。

          • ローカルアップロード: データテーブル (XLS または XLSX 形式で、最初の行はテーブルヘッダーである必要があります) をコンピューターから直接アップロードします。

          • クラウドインポート (データテーブルの選択): アプリケーション内の既存のデータテーブルを選択します。手順については、「データインポート」をご参照ください。

        2. インデックス構成: インポートされたデータの処理方法と保存方法を定義します。これは取得パフォーマンスに直接影響します。

          以下の設定項目のうち、ADB-PG を選択した場合に料金が発生する可能性があるのは「ベクトルストレージ」のみです。他のすべての構成は無料です。

          取得に参加/モデル応答に参加

          • 取得に参加: 有効にすると、ナレッジベースはこのデータ列内で検索できるようになります。

          • モデル応答に含める: 有効にすると、この列からの取得結果が LLM の応答生成の入力として使用されます。たとえば、次の図に示す構成では、「名前」、「性別」、「役職」、「年齢」の列に対して [取得に参加] が有効になっており、「名前」と「役職」の列に対して [モデル応答に含める] が有効になっています。この場合、ナレッジベースはすべての列からデータを取得します。ただし、取得されたデータの「名前」と「役職」の列のコンテンツのみが、応答の生成を支援するために LLM に提供されます。

            image

            下の図に示すように、「年齢」がモデル応答に参加するように有効になっていないため、LLM はこのナレッジベースに関連付けられた後でも「張三の年齢は?」という質問に答えることができません。

            image

          複数ラウンドの会話の書き換え

          この機能を有効にすると、システムは専用の軽量モデルを呼び出して、会話履歴を取り込むことでユーザーの現在の質問を独立した文脈的に完全な新しいクエリに書き換えます。この新しいクエリは、ナレッジベースの取得に使用されます。

          埋め込みモデル

          埋め込みモデルは、元の入力プロンプトとナレッジテキストを数値埋め込みに変換して、それらのセマンティック類似度を計算します。デフォルトモデル (変更不可) は、中国語と英語に加えて複数の言語をサポートし、結果のベクトルを正規化します。

          ナレッジベース内の異なるベクトルモデルによって生成されるベクトルディメンション:

          以下のベクトルディメンションは変更できません。
          • text-embedding-v2: 1,536 ディメンション

          再ランキングモデル

          再ランキングモデルは、ベクトル検索によって最初に取得された候補セグメントに対して二次的なランキングを実行し、類似度スコアが最も高い上位 K 個のテキストセグメントを返します。公式ランキングモデル (推奨) は、セマンティックな関連性とキーワードマッチングアルゴリズム (BM25 など) を組み合わせて、正確なキーワードヒットを必要とするクエリをより適切に処理します。セマンティックランキングのみが必要な場合は、GTE-ReRank モデルを選択します。

          類似度のしきい値

          このしきい値は、テキストセグメントが取得されるための最小類似度スコアを表します。再ランキングモデルによって返されるテキストセグメントをフィルタリングするために使用されます。この値を超えるスコアを持つテキストセグメントのみが取得されます。

          説明

          この設定は、ナレッジベースのデフォルトの類似度のしきい値です。ナレッジベースを特定のアプリケーションに関連付ける場合、そのアプリケーションに別のしきい値を設定することもでき、これはナレッジベースのデフォルトの類似度のしきい値をオーバーライドします。

          このしきい値を下げると、より多くのテキストセグメントが取得されることが期待されますが、関連性の低いセグメントが取得される可能性があります。このしきい値を上げると、取得されるテキストセグメントの数が減少します。高すぎると、ナレッジベースが関連するテキストセグメントを破棄する原因になります。

          ヒットテストを使用して、取得率と精度のバランスを取るために類似度のしきい値を微調整できます。

          最大再呼び出し回数

          アプリケーションが 3 つのナレッジベース A1、A2、A3 に関連付けられているとします。システムは、これらのベースからユーザーの入力に関連するセグメントを取得し、再ランキングモデルを使用してそれらを再ランク付けし、上位 K 個の最も関連性の高いセグメントを選択して、LLM に応答のコンテキストとして提供します。この値 K は、最大取得数 (最大 20) です。これは、再ランキングモデルが参照用に LLM に提供するテキストセグメントの数を決定します。

          この値を増やすと、LLM の応答の精度が向上する可能性がありますが、LLM が消費する入力トークンの数も増加します。

          ベクトルストレージ

          テキストベクトルを保存するベクトルデータベースを選択します。プラットフォームストレージベクトルデータベースは、ナレッジベースの基本的な機能要件には十分です。データベースの管理、監査、監視などの高度な機能については、選択 ADB-PG (AnalyticDB for PostgreSQL) をお勧めします。

          ADB-PG インスタンスを購入する際は、ベクトルエンジン最適化を有効にする必要があることに注意してください。そうしないと、Model Studio はこのインスタンスを使用できません。
    • 画像 Q&A (画像による検索シナリオ用)

      • シナリオ:

        • このタイプは、製品ショッピングガイドや画像 Q&A アシスタントなど、画像による検索や画像とテキストによる検索などのマルチモーダル検索アプリケーションの構築に適しています。

      • データソース: ローカルの XLS または XLSX ファイルをアップロードできます。

        XLS および XLSX ファイルには、画像インデックスを構築するために一般公開されている画像 URL が含まれている必要があります。詳細については、以下の作成手順を参照してください。

        作成手順 (画像 Q&A)

        1. データの選択: ナレッジベースのファイルやコンテンツなどのデータソースを指定します。データソースのコンテンツは、後続の取得のためにナレッジベースにインポートされます。ローカルアップロードクラウドインポート (アプリケーションデータから既存のデータテーブルを選択) の 2 つの方法がサポートされています。

          説明

          ナレッジベースの作成後にデータソースを変更することはできず、1 つのナレッジベースで複数のデータソースを同時にサポートすることはできません。

          • ローカルアップロード: データテーブル (XLS または XLSX 形式) をコンピューターから直接アップロードします。

            説明
            • フィールド: データテーブルには、画像インデックスを生成するために、image_url 型のフィールドが少なくとも 1 つ含まれている必要があります。

            • ビルドプロセス: ナレッジベースは image_url フィールドの画像 URL にアクセスし、視覚的特徴を抽出し、それらを保存されたベクトルに変換します。

            • 取得プロセス: ナレッジベースは、ユーザーがアップロードした画像から生成されたベクトルを保存された画像ベクトルと比較して類似性を判断し、最も関連性の高いレコードを返します。

          • クラウドインポート (データテーブルの選択): Model Studio のアプリケーションデータから既存のデータテーブルを選択します。詳細については、「データインポート」をご参照ください。

        2. インデックス構成: インポートされたデータの処理方法と保存方法を定義します。これは取得パフォーマンスに直接影響します。

          以下の設定項目のうち、ADB-PG を選択した場合に料金が発生する可能性があるのは「ベクトルストレージ」のみです。他のすべての構成は無料です。

          取得に参加/モデル応答に参加

          • 取得に参加: 有効にすると、ナレッジベースはこのデータ列内で検索できるようになります。

          • モデル応答に含める: 有効にすると、この列からの取得結果が LLM の応答生成の入力として使用されます。たとえば、次の図に示す構成では、「名前」、「性別」、「役職」、「年齢」の列に対して [取得に参加] が有効になっており、「名前」と「役職」の列に対して [モデル応答に含める] が有効になっています。この場合、ナレッジベースはすべての列からデータを取得します。ただし、取得されたデータの「名前」と「役職」の列のコンテンツのみが、応答の生成を支援するために LLM に提供されます。

            image

            下の図に示すように、「年齢」がモデル応答に参加するように有効になっていないため、LLM はこのナレッジベースに関連付けられた後でも「張三の年齢は?」という質問に答えることができません。

            image

          複数ラウンドの会話の書き換え

          この機能を有効にすると、システムは専用の軽量モデルを呼び出して、会話履歴を取り込むことでユーザーの現在の質問を独立した文脈的に完全な新しいクエリに書き換えます。この新しいクエリは、ナレッジベースの取得に使用されます。

          ベクトルモデル

          ベクトルモデルは、元の入力プロンプト、ナレッジテキスト、画像を数値ベクトルに変換して類似度を比較します。デフォルトのマルチモーダル埋め込み v1 (multimodal-embedding-v1) モデル (変更不可) は、中国語と英語の両方、およびさまざまな画像およびビデオ形式をサポートし、ベクトル結果を正規化し、ほとんどのシナリオに適しています。詳細については、「テキストとマルチモーダル埋め込み」をご参照ください。

          再ランキングモデル

          再ランキングモデルは、ベクトル検索によって最初に取得された候補セグメントに対して二次的なランキングを実行し、類似度スコアが最も高い上位 K 個のテキストセグメントを返します。公式ランキングモデル (推奨) は、セマンティックな関連性とキーワードマッチングアルゴリズム (BM25 など) を組み合わせて、正確なキーワードヒットを必要とするクエリをより適切に処理します。セマンティックランキングのみが必要な場合は、GTE-ReRank モデルを選択します。

          類似度のしきい値

          このしきい値は、テキストセグメントが取得されるための最小類似度スコアを表します。再ランキングモデルによって返されるテキストセグメントをフィルタリングするために使用されます。この値を超えるスコアを持つテキストセグメントのみが取得されます。

          説明

          この設定は、ナレッジベースのデフォルトの類似度のしきい値です。ナレッジベースを特定のアプリケーションに関連付ける場合、そのアプリケーションに別のしきい値を設定することもでき、これはナレッジベースのデフォルトの類似度のしきい値をオーバーライドします。

          このしきい値を下げると、より多くのテキストセグメントが取得されることが期待されますが、関連性の低いセグメントが取得される可能性があります。このしきい値を上げると、取得されるテキストセグメントの数が減少します。高すぎると、ナレッジベースが関連するテキストセグメントを破棄する原因になります。

          ヒットテストを使用して、取得率と精度のバランスを取るために類似度のしきい値を微調整できます。

          最大取得数

          アプリケーションが 3 つのナレッジベース A1、A2、A3 に関連付けられているとします。システムは、これらのベースからユーザーの入力に関連するセグメントを取得し、再ランキングモデルを使用してそれらを再ランク付けし、上位 K 個の最も関連性の高いセグメントを選択して、LLM に応答のコンテキストとして提供します。この値 K は、最大取得数 (最大 20) です。これは、再ランキングモデルが参照用に LLM に提供するテキストセグメントの数を決定します。

          この値を増やすと、LLM の応答の精度が向上する可能性がありますが、LLM が消費する入力トークンの数も増加します。

          ベクトルストレージ

          テキストベクトルを保存するベクトルデータベースを選択します。プラットフォームストレージベクトルデータベースは、ナレッジベースの基本的な機能要件には十分です。データベースの管理、監査、監視などの高度な機能については、選択 ADB-PG (AnalyticDB for PostgreSQL) をお勧めします。

          ADB-PG インスタンスを購入する際は、ベクトルエンジン最適化を有効にする必要があることに注意してください。そうしないと、Model Studio はこのインスタンスを使用できません。
  3. ピーク時には、データ量によっては作成プロセス全体に数時間かかる場合があります。しばらくお待ちください。

ナレッジベースの更新

ナレッジベースのコンテンツへの変更は、それを参照するすべてのアプリケーションとリアルタイムで同期されます。

ドキュメント検索ナレッジベース

  • 自動更新 (推奨)

    これは、OSS、FC、および Model Studio ナレッジベースの API を統合することで実現できます。次の簡単な手順に従ってください:

    1. バケットの作成: OSS コンソールに移動し、元のファイルを保存するための OSS バケットを作成します。

    2. ナレッジベースの作成: プライベートナレッジコンテンツを保存するための非構造化ナレッジベースを作成します。

    3. ユーザー定義関数の作成: FC コンソールに移動し、ファイルの作成や削除などのファイル変更イベントの関数を作成します。詳細については、「関数の作成」をご参照ください。これらの関数は、ナレッジベース API ガイドから関連する API を呼び出すことで、OSS のファイルの変更を作成されたナレッジベースに同期します。

    4. OSS トリガーの作成: FC で、前のステップで作成したユーザー定義関数に OSS トリガーを関連付けます。ファイル変更イベントが検出されると (たとえば、新しいファイルが OSS にアップロードされた場合)、対応するトリガーがアクティブになり、FC が対応する関数を実行するようにトリガーします。

  • 手動更新

    [ナレッジベース] ページで、ターゲットのナレッジベースを見つけ、そのカードの [詳細の表示] をクリックします。

    • 新しいファイルの追加方法: [データのアップロード] をクリックし、アプリケーションデータ内の既存のファイルを選択します。詳細については、「アプリケーションデータにファイルをアップロードする方法」をご参照ください。

    • ファイルの削除方法: ターゲットファイルを見つけ、その右側にある [削除] をクリックします。

      この操作は、ナレッジベースからファイルを削除するだけで、[アプリケーションデータ] のソースファイルは削除されません。
    • ファイルコンテンツの変更方法: インプレース更新とファイルアップロードの上書きはサポートされていません。まず、ナレッジベースから古いバージョンのファイルを削除し、次に新しい変更されたバージョンを再インポートする必要があります。

      注意: 古いバージョンのファイルを保持すると、古いコンテンツが取得されてリコールされる可能性があります。

データクエリおよび画像 Q&A ナレッジベース

  • 自動更新

    サポートされていません。

  • 手動更新

    ナレッジベースのデータソースがアプリケーションデータのデータテーブルである場合、手動でのみ更新できます。プロセスには 2 つのステップが含まれます。

    1. ステップ 1: データテーブルの更新

      [アプリケーションデータ] タブに移動します。左側のリストで、ターゲットのデータテーブルを選択し、[データのインポート] をクリックします。

      • 新しいデータの挿入方法: インポートタイプを [増分アップロード] に設定します。テーブルヘッダーと新しいデータ行のみを含む Excel ファイルをアップロードする必要があります。

        ファイルのヘッダーは現在のテーブルスキーマと一致する必要があります。ページの [テンプレートのダウンロード] 機能を使用して標準のヘッダーファイルを取得し、新しいデータを直接入力できます。
      • データの削除方法: インポートタイプを [アップロードして上書き] に設定します。ヘッダーと最新の完全なデータ (削除するレコードを削除したもの) を含む Excel ファイルをアップロードする必要があります。

        完全なデータの取得方法: ページの image アイコンをクリックして、データを XLSX 形式でダウンロードします。
      • データの変更方法: インポートタイプを [アップロードして上書き] に設定します。ヘッダーと最新の完全なデータ (対応する変更を含む) を含む Excel ファイルをアップロードする必要があります。

    2. ステップ 2: 変更をナレッジベースに同期する

      [ナレッジベース] リストに戻り、ターゲットのナレッジベースを見つけ、そのカードの [詳細の表示] をクリックします。データテーブルの左上にある image アイコンをクリックします。操作を確認すると、データテーブルの最新のコンテンツがナレッジベースに同期されます。

      その後の更新後も、上記の手順を手動で繰り返す必要があります。データソースとして「アプリケーションデータ」を使用するナレッジベースでは、データの変更を自動的に同期することはできません。

ナレッジベースの編集

ナレッジベースを作成した後、変更できるのはナレッジベース名ナレッジベースの説明類似度のしきい値のみです。その他の構成は変更できません。API を使用したナレッジベースの編集はサポートされていません。

プロシージャ: [ナレッジベース] ページで、ターゲットのナレッジベースを見つけ、そのカードの image アイコンをクリックし、[編集] をクリックします。

ナレッジベースの削除

説明

この操作では、[アプリケーションデータ] のソースファイルやデータテーブルは削除されません。

警告

この操作は元に戻せません。慎重に進めてください。

ナレッジベースを削除する前に、まずすべての公開済みアプリケーションから関連付けを解除する必要があります。

関連付けられている未公開のアプリケーションは、削除操作をブロックしません。

ナレッジベースを削除する手順

  1. ナレッジベースに関連付けられている各公開済みアプリケーションに対して、次の操作を実行します:

    1. [マイアプリケーション] ページで、ナレッジベースに関連付けられているアプリケーションを見つけ、[構成] をクリックします。

    2. ナレッジベースリストからナレッジベースを削除します。ページの右上隅にある [公開] をクリックし、指示に従ってアプリケーションを再公開します。

    3. ナレッジベースに関連付けられているすべての公開済みアプリケーションに対して、上記の手順を繰り返します。

  2. [ナレッジベース] ページで、ターゲットのナレッジベースを見つけ、カードの image アイコンをクリックし、[削除] をクリックします。

ヒットテスト

ナレッジベースを構築したものの、実際の使用で AI アプリケーションがしばしば無関係な回答を提供したり、ナレッジベースに存在する情報を見つけられなかったりすることがあるとします。ヒットテストは、これらの問題を事前に特定して解決するのに役立つ重要なツールです。

ヒットテストを使用すると、次のことができます:

  • ナレッジベースが AI アプリケーションに効果的なナレッジ入力を提供できるかどうかを確認します。

  • 類似度のしきい値を微調整して、取得率と精度のバランスを取ります。

  • ナレッジベースのコンテンツのギャップや品質の問題を発見します。

シナリオ例

  • シナリオ 1: 顧客が製品価格について問い合わせる

    テスト入力: 「Bailian phone の価格はいくらですか?」
    期待される結果: 価格情報を含む関連テキストセグメントを取得できる必要があります。
  • シナリオ 2: 技術的な問題のトラブルシューティング

    テスト入力: 「デバイスが WiFi に接続できない場合はどうすればよいですか?」
    期待される結果: WiFi 接続のトラブルシューティングに関する関連テキストセグメントを取得できる必要があります。

プロシージャ

  1. [ナレッジベース] ページで、ターゲットのナレッジベースを見つけ、そのカードの [ヒットテスト] をクリックします。

  2. テストインターフェイスに質問を入力し (事前にユーザーからよく寄せられる質問を収集することをお勧めします)、取得結果を観察します。

    • 取得結果: このテストキーワードのヒット結果 (類似度の降順でソート)。任意のセグメントをクリックして、その特定のコンテンツを表示します。

    • imageアイコン: 画像 Q&A ナレッジベースの場合、システムはまず入力画像をベクトルに変換し、関連するレコードを取得します。次に、これらのレコードを質問とともに LLM に送信して回答を生成します。ドキュメント検索またはデータクエリナレッジベースの場合、アップロードされた画像は取得に参加しません。

  3. 関連するテキストセグメントが正しく取得されているかどうかを確認します。そうでない場合は、類似度のしきい値を調整し、前の手順を繰り返す必要があります。

  4. [履歴取得レコードの表示] をクリックして、過去のさまざまな閾値設定での取得パフォーマンスを比較します。

image

クォータと制限

  • ナレッジベースでサポートされているデータソースと容量については、「ナレッジベースのクォータと制限」をご参照ください。

  • 各アプリケーションは、最大 5 つのドキュメント検索ナレッジベース、5 つのデータクエリナレッジベース、および 1 つの画像 Q&A ナレッジベースに関連付けることができます。

課金

ナレッジベース機能は無料ですが、ナレッジベースを参照するアプリケーションを呼び出すと料金が発生する場合があります。

ステップ

課金情報

ナレッジベースの構築

無料。

ビジネスアプリケーションとの統合

アプリケーションを呼び出すと、ナレッジベースから取得されたテキストセグメントによって LLM の入力トークン数が増加します。これにより、モデル推論 (呼び出し) コストが増加する可能性があります。モデル推論 (呼び出し) コストの詳細については、「課金項目」をご参照ください。

注意: 取得 API を呼び出して指定されたナレッジベースからのみ取得し、生成にアプリケーションを使用しない場合、料金は発生しません。

管理と O&M

無料。

API リファレンス

よくある質問

ナレッジベースの構築

  • Q: ナレッジベースにインポートされたファイルまたはデータテーブルをアプリケーションデータから削除できますか?

    • ドキュメント検索ナレッジベース: はい、できます。アプリケーションデータのファイルとナレッジベースは独立したデータコピーです。アプリケーションデータのソースファイルを削除しても、ナレッジベースにすでにインポートされているファイルには影響しません。

    • データクエリおよび画像 Q&A ナレッジベース: いいえ、できません。そうすると、データ同期やナレッジベースの表示などの機能に異常が発生します。

画像とマルチモーダルコンテンツの処理

  • Q: 私のファイルには、アプリケーションの応答で返される必要があるイラストが含まれています。どのように処理すればよいですか?

    ドキュメント検索ナレッジベースを使用する

    方法 1 (エージェントアプリケーションのみ)

    1. ナレッジベースを作成する際、ナレッジベースタイプに [ドキュメント検索] を選択し、シナリオに [イラスト付き] を選択します。

      ナレッジベースは、ファイルのイラストから要約を抽出します。LLM は、要約と質問の関連性に基づいて、画像を挿入するかどうかを自律的に決定します。

      image

    2. エージェントアプリケーションを作成または編集する際、Qwen-Plus または Qwen-Plus-Latest モデルを選択します (これら 2 つは最高のパフォーマンスを持つことがテストされています)。[ドキュメント] の右側にある [+] ボタンをクリックし、前のステップで作成したナレッジベースを追加します。

      注意: 「イラスト付き」機能と「ソースを表示」機能は同時に有効にできません。
    3. 実際の Q&A 効果:

      image

    方法 2 (エージェントアプリケーションおよびワークフローアプリケーション用)

    1. 一般公開されている場所に画像をアップロードし、その完全な URL を取得します。OSS を使用することをお勧めします。詳細については、「OSS に画像をアップロードしてそのファイル URL を使用する」をご参照ください。

    2. 完全な URL (相対パスはサポートされていません) をファイルに挿入します。注意: ドキュメントに画像ファイルを直接埋め込むことはサポートされていません (たとえば、コピーアンドペーストやメニューからローカル画像を挿入するなど)。一般公開されている URL を使用して画像を参照する必要があります。

      指示に従っても画像が表示されない場合は、テキストセグメント内の URL が完全であるかどうかを確認してください。余分なスペースや特殊文字がないか確認してください。これらはシステムによって誤って解釈される可能性があります。問題がある場合は、直接編集して修正できます。

      ファイル内で画像を正しく参照する例

      サンプルプロンプトテンプレート

      実際の Q&A 効果

      image

      # ナレッジベース
      次の資料を覚えておいてください。質問に答えるのに役立つ場合があります。
      ${documents}
      
      # 要件
      画像がある場合は、表示してください。

      image

      ファイル内で画像を誤って参照する例

      サンプルプロンプトテンプレート

      実際の Q&A 効果

      image

      # ナレッジベース
      次の資料を覚えておいてください。質問に答えるのに役立つ場合があります。
      ${documents}
      
      # 要件
      画像がある場合は、表示してください。

      image

      説明: 画像がファイルに直接挿入されている場合、アプリケーションはその応答に画像を表示しません。

    画像 Q&A ナレッジベースを使用する

    1. インターネット経由でアクセスできる場所に画像をアップロードし、その完全な URL を取得します。OSS を使用することをお勧めします。詳細な手順については、「OSS に画像をアップロードしてそのファイル URL を使用する」をご参照ください。

    2. [テーブル] タブで、新しいデータテーブルを作成し、画像の完全な URL を保存するための image_url フィールドを追加します。

      説明
      • image_url フィールドは相対パスをサポートしていません。

      • 単一の image_url フィールドは、複数の画像 URL の保存をサポートしていません。単一のレコードを複数の画像に関連付ける必要がある場合は、image_1image_2 など、画像ごとに個別の image_url フィールドを作成する必要があります。

      • 現在のバージョンでは、単一のフィールドに複数の画像 URL を保存することはサポートされていません。

      • データテーブル内の各 image_url が指す画像ファイルのサイズが 3 MB を超えないようにしてください。制限を超えると、ナレッジベースの作成が失敗します。

      • データテーブルを作成した後、image_url 型のフィールドを追加または変更することはできません。最初にテーブルスキーマを設計する際に、必要になる可能性のあるすべての画像フィールドを予約してください。

      image

    3. ナレッジベースを構築する際、[ナレッジベースタイプ] として [画像 Q&A] を選択します。

    4. エージェントアプリケーションを作成または編集する際、[画像] (画像 Q&A ナレッジベース) の右側にある [+] ボタンをクリックし、前のステップで作成したナレッジベースを追加します。プロンプトテンプレートを次のように変更します:

      # ナレッジベース
      次の資料を覚えておいてください。質問に答えるのに役立つ場合があります。
      ${documents}
      
      # 要件
      画像がある場合は、表示してください。
    5. 次に、右側の入力ボックスで質問をします。

      例: 「Model Studio X1 phone を簡単に紹介してください。」

      画像を正しく参照する例

      サンプルプロンプトテンプレート

      ユーザープロンプトとアプリケーションから返された結果

      image

      # ナレッジベース
      次の資料を覚えておいてください。質問に答えるのに役立つ場合があります。
      ${documents}
      
      # 要件
      画像がある場合は、表示してください。

      image

権限とセキュリティ

  • Q: ナレッジベースを操作しているときに、「このモジュールの権限がありません」というエラーが発生します。どのように対処すればよいですか?

    デフォルトでは、RAM ユーザーはナレッジベースの作成、更新、削除などの書き込み操作を実行できません。Alibaba Cloud アカウントは、ユーザーに 管理者 ページ権限、または少なくとも ApplicationData-FullAccessKnowledgeBase-FullAccess を含む権限を付与する必要があります。

  • Q: ナレッジベースはプライベートですか?他の組織やユーザーはアクセスできますか?

    ナレッジベースは、ワークスペース内のメンバーにアクセスと操作が制限されています。一般公開されていません。

  • Q: Alibaba Cloud は、私のアカウントのナレッジベースを他のユーザーの質問に回答するために使用しますか?

    Alibaba Cloud はデータプライバシーを厳格に保護しており、お客様のナレッジベースを他のユーザーの質問への回答やモデルトレーニングに使用することはありません。データセキュリティとプライバシーに関する当社のコミットメントの詳細については、「プライバシーポリシー」をご参照ください。

移行とエクスポート

  • Q: ナレッジベースをローカルマシンにエクスポートするにはどうすればよいですか?

    ワンクリックエクスポートはサポートされていません。代替として、次の方法で手動でデータを取得できます:

    • [アプリケーションデータ] から元のファイルまたはデータテーブルをダウンロードします。

    • <a baseurl="t2733975_v32_2_0.xdita" data-node="5041929" data-root="85177" data-tag="xref" href="t2743546.xdita#" id="eaefa2ec919gs">ListChunks</a> API を呼び出してドキュメントとセグメントのデータをバッチプルするスクリプトを作成します。