すべてのプロダクト
Search
ドキュメントセンター

Vector Retrieval Service for Milvus:Vector Retrieval Service for Milvus と Dify プラットフォームを使用した RAG システムの構築

最終更新日:Oct 27, 2025

この Topic では、Vector Retrieval Service for Milvus (Milvus) と Dify プラットフォームを使用して、検索拡張生成 (RAG) システムを構築する方法について説明します。

背景情報

RAG の原則

大規模言語モデル (LLM) は、知識が限られているため、しばしばハルシネーション (幻覚) を起こします。検索拡張生成 (RAG) 技術は、外部のナレッジベースに接続することで、この課題を解決します。効率的な RAG システムには、強力なベクトルデータベースが必要です。

この Topic では、Milvus と Dify ローコード人工知能 (AI) プラットフォームに焦点を当てます。これらを組み合わせて、エンタープライズグレードの RAG アプリケーションを迅速に構築する方法を紹介します。これは、AI における「ラストワンマイル」問題を解決する上でのベクトルデータベースのコアバリューを実証するものです。

Dify プラットフォームについて

Dify は、AI アプリケーションを開発するためのオープンソースプラットフォームです。ローコードのパイプラインとユーザーフレンドリなインターフェイスが特徴です。そのコアミッションは、BaaS (Backend-as-a-Service) と LLMOps (LLM Operations) の概念を統合することで、AI アプリケーションの構築プロセスを簡素化し、加速することです。

Dify はフルスタックのソリューションです。バックエンドでは、API サービスやデータ管理など、信頼性の高いインフラストラクチャを提供します。これにより、開発者はゼロから構築する必要がなくなります。LLMOps に関しては、Dify はプロンプトエンジニアリングのための直感的なビジュアルインターフェイスを提供し、複雑なプロンプトのワークフローを簡素化します。組み込みの高品質な RAG エンジンは、会社のドキュメントやデータベースなどの非公開のナレッジベースに接続します。この接続により、大規模言語モデルはドメイン固有の知識を使用して質問に答えることができ、ハルシネーションを減らし、回答の正確性と追跡可能性を確保します。

前提条件

手順

ステップ 1: Dify のインストール

  1. GitHub からオープンソースの Dify プロジェクトをローカルマシンにクローンします。

    git clone https://github.com/langgenius/dify.git
  2. デプロイメントディレクトリに移動し、.env 構成ファイルをバックアップします。

    cd dify/docker/
    cp .env.example .env
  3. .env ファイルで次の構成情報を変更します。

    # ベクトルストレージエンジンの構成
    VECTOR_STORE=milvus  # Milvus をベクトルストレージエンジンとして指定
    
    # Milvus 接続情報
    MILVUS_URI=http://YOUR_ALIYUN_MILVUS_ENDPOINT:19530
    MILVUS_USER=YOUR_ALIYUN_MILVUS_USER
    MILVUS_PASSWORD=YOUR_ALIYUN_MILVUS_PASSWORD

    この例では、次のパラメーターを使用します。実際の値に置き換えてください。

    パラメーター

    説明

    MILVUS_URI

    Milvus インスタンスのエンドポイント。フォーマットは http://<パブリック IP アドレス>:<ポート> です。

    • <パブリック IP アドレス>: これは、Milvus インスタンスの [インスタンス詳細] ページで確認できます。

    • <ポート>: これは、Milvus インスタンスの [インスタンス詳細] ページで確認できます。デフォルトのポートは 19530 です。

    MILVUS_USER

    Milvus インスタンスの作成時に指定したユーザー名。

    MILVUS_PASSWORD

    Milvus インスタンスの作成時に指定したユーザーのパスワード。

  4. Dify を起動します。

    docker compose up -d --build

    image

  5. ブラウザで http://127.0.0.1/ にアクセスして Dify サービスにアクセスします。管理者アカウントとパスワードを設定し、コンソールにログインします。

    説明

    Dify が Elastic Compute Service (ECS) インスタンスや仮想マシン (VM) などのリモートサーバーで実行されている場合は、127.0.0.1 をサーバーのパブリック IP アドレスまたはドメイン名に置き換えてください。サーバーがネットワーク経由でアクセス可能であることを確認してください。

    image

ステップ 2: モデルの設定

  1. ログイン後、右上のプロファイル画像をクリックし、ドロップダウンメニューから [設定] を選択します。

    image

  2. 左側のナビゲーションウィンドウで、[モデルプロバイダー] を選択します。右側で Qwen を見つけてインストールします。

  3. モデルがインストールされたら、[Set API-KEY] をクリックします。Alibaba Cloud Model Studio プラットフォームから取得した API キーを入力します。

    image

  4. 必要に応じて [システムモデル設定] を構成します。

    image

ステップ 3: ナレッジベースの作成

  1. ページの上部で [ナレッジ] をクリックし、次に [ナレッジベースの作成] をクリックします。

    image

  2. データソースとして [テキストファイルからインポート] を選択します。README.md をクリックしてサンプルデータをダウンロードします。次に、サンプルデータファイルをアップロードします。

    image

  3. パラメーターを変更し、[保存して処理] をクリックします。

    image

    この例では、次のパラメーターを変更します。

    • [最大セグメント長]: 1024 に設定します。

    • [埋め込みモデル]: text-embedding-v1 を選択します。

    プロセスが完了すると、ナレッジベースが作成されます。

    image

ステップ 4: ベクトル取得の検証

Alibaba Cloud Milvus コンソールにログインし、Milvus インスタンスを選択します。右上の [Attu Manager] をクリックして Attu ページを開きます。対応するコレクションデータがインポートされていることを確認できます。詳細については、「Attu ツール管理」をご参照ください。

ステップ 5: RAG パフォーマンスの検証

  1. ページの上部にある [Studio] をクリックしてホームページに戻ります。[テンプレートから作成] を選択します。

    image

  2. 検索ボックスで、ナレッジ取得 + チャットボットテンプレートを検索して使用します。

    image

  3. 表示されるダイアログボックスで、[作成] をクリックします。

    image

  4. ナレッジ取得ノードを選択します。ナレッジベースを前のステップで作成したものに設定します。

    image

  5. LLM ノードを選択し、モデルを qwen-max に設定します。

    image

  6. 右上の [公開] をクリックし、次に [更新を公開] をクリックします。

    image

  7. [実行] をクリックしてテストページを開きます。ナレッジベースのコンテンツに関連する質問を入力して、回答を受け取ります。