すべてのプロダクト
Search
ドキュメントセンター

Microservices Engine:AI RAG

最終更新日:Mar 22, 2025

このトピックでは、ai-rag プラグインについて説明します。

クラウドネイティブ ゲートウェイは、Alibaba Cloud DashVector に接続して、大規模言語モデル(LLM)の Retrieval Augmented Generation (RAG)を迅速に実装できます。次の図は、RAG を実装するプロセスを示しています。

image

実行属性

プラグイン実行ステージ: default stage。プラグイン実行優先度: 400

構成の説明

名前

データ型

必須

デフォルト値

説明

dashscope.apiKey

string

はい

-

ゲートウェイが Qwen にアクセスするときに認証に使用されるトークン。

dashscope.serviceFQDN

string

はい

-

Qwen のサービス名。

dashscope.servicePort

int

はい

-

Qwen のサービスポート。

dashscope.serviceHost

string

はい

-

Qwen にアクセスするために使用されるドメイン名。

dashvector.apiKey

string

はい

-

ゲートウェイが Alibaba Cloud DashVector にアクセスするときに認証に使用されるトークン。

dashvector.serviceFQDN

string

はい

-

Alibaba Cloud DashVector のサービス名。

dashvector.servicePort

int

はい

-

Alibaba Cloud DashVector のサービスポート。

dashvector.serviceHost

string

はい

-

Alibaba Cloud DashVector にアクセスするために使用されるドメイン名。

dashvector.topk

int

はい

-

Alibaba Cloud DashVector によって実行されるベクトル検索中に取得されるベクトルの数。

dashvector.threshold

float

はい

-

ベクトル距離のしきい値。システムは、ベクトル距離が指定されたしきい値を超えるドキュメントを除外します。

dashvector.field

string

はい

-

Alibaba Cloud DashVector に保存されているドキュメントのフィールド名。

説明

プラグインが有効になっている場合、トレース分析機能を使用すると、トラブルシューティングのために、ai-rag プラグインによって取得されたドキュメント IDspanattribute に追加されます。

dashscope:
    apiKey: xxxxxxxxxxxxxxx
    serviceFQDN: dashscope
    servicePort: 443
    serviceHost: dashscope.aliyuncs.com
dashvector:
    apiKey: xxxxxxxxxxxxxxxxxxxx
    serviceFQDN: dashvector
    servicePort: 443
    serviceHost: vrs-cn-xxxxxxxxxxxxxxx.dashvector.cn-hangzhou.aliyuncs.com
    collection: xxxxxxxxxxxxxxx
    topk: 1
    threshold: 0.4
    field: raw

CEC-Corpus データセットには、332 件の緊急事態に関するニュース レポートのコーパスとラベル付きデータが含まれています。元のプレス リリース テキストが抽出され、ベクトル化されてから、Alibaba Cloud DashVector に追加されます。

次のコンテンツは、ai-rag プラグインを使用して RAG 機能を実装する例を示しています。元のリクエストは次のとおりです。Where did the Hainan rear-end collision occur? What is the reason? What are the casualties?

  • ai-rag プラグインの処理なしで LLM によって返される結果:

    申し訳ありません。AI モデルとして、場所、原因、死傷者などの詳細を含む、ニュース イベントに関する特定の情報をリアルタイムで取得および更新することはできません。このような特定のイベントについては、正確な情報を得るために、最新のニュース レポートまたは公式発表を確認することをお勧めします。また、主要メディアの Web サイトにアクセスしたり、ニュース アプリケーションを使用したり、関連する政府部門の発表をフォローしたりして、最新のニュースを入手することもできます。

  • ai-rag プラグインの処理後に LLM によって返される結果:

    海南島の追突事故は、海文高速道路の文昌から海口まで 37 km の地点で発生しました。事故の具体的な原因については、当時、交通警察部門がまだ調査中でした。提供された情報に基づいて事故の正確な原因を特定することはできません。死傷者は 1 名が死亡(運転手がその場で死亡)し、8 名が負傷(子供 2 名と大人 6 名を含む)しました。負傷者全員が救助され、病院に搬送されて治療を受けました。