すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:Dify

最終更新日:Jun 13, 2026

Dify は、AI アプリケーションを構築するためのオープンソースプラットフォームです。Alibaba Cloud Model Studio のモデル API を使用してアプリケーションを構築できます。

前提条件

API キーを取得し、Model Studio で必要なモデルサービスを有効化する必要があります。

1. モデルの設定

1.1. モデルプロバイダーのインストール

Dify Marketplace にアクセスします。モデル の下で Qwen を見つけ、最新バージョンのプラグインをインストールします。

説明
  • TONGYI プラグインは Alibaba Cloud ではなく Dify がメンテナンスしています。最新バージョンのインストール時にエラーが発生した場合は、以前のバージョンを試してください。

  • Model Studio の DeepSeek モデルを使用するには、Qwen プラグインも併用する必要があります。

1.2. API キーの構成

ページの右上隅で、プロフィール画像 → 設定 をクリックします。モデルプロバイダー の下で、Qwen カードを見つけ、設定 をクリックします。

  • シンガポールリージョンのモデルを使用する場合、API-KEY Settings セクションに移動し、該当リージョンの API キーを入力して、Use International EndpointYes に設定します。

  • 北京リージョンのモデルを使用する場合、API-KEY Settings セクションに移動し、北京リージョンの API キーを入力して、Use International EndpointNo に設定します。

構成中に Invalid API key provided エラーが表示された場合は、TONGYI プラグインの以前のバージョンをインストールしてみてください。

20251127172111

1.3. モデルの選択

Qwen カード上でクリックしてモデル一覧を表示し、必要なモデルのスイッチを有効にします。

プラグインに最新の Qwen モデルが含まれていない場合は、OpenAI-API-compatible プラグインをインストールできます。プラグイン設定で API endpoint URL を以下のいずれかに設定します:https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1(シンガポールリージョン)または https://dashscope.aliyuncs.com/compatible-mode/v1(中国 (北京) リージョン)WorkspaceId は実際の ワークスペース ID を取得する に置き換えてください。

2. クイックスタート

Dify は複数のアプリケーションタイプをサポートしています。ご自身の用途に合わせて手順を選択してください。

チャットアシスタントおよびエージェント

  1. チャットアシスタントまたはエージェントの作成

    ワークスペースCreate blank app をクリックします。初心者向け の下でチャットアシスタントまたはエージェントを作成・開きます。

  2. モデルの選択

    アプリケーションページの右上隅でモデルを選択します。例として、Qwen の下で qwen-plus-latest(Qwen3) を選択し、思考モードを有効にします。

  3. 会話のテスト

    「Who are you?」と入力します。モデルは思考プロセス完了後に応答します。

    また、Qwen-VL または QVQ モデルを使用して画像に関する質問を行うこともできます。ビジョンモデルを選択すると、左側に Vision スイッチが表示されます。これを有効にすると、右側のチャットウィンドウで画像をアップロードできます。

Chatflow およびワークフロー

  1. Chatflow またはワークフローの作成

    ワークスペース で Chatflow またはワークフローを作成・開きます。

  2. LLM ノードの追加

    キャンバスに LLM ノードを追加します。ノードを選択して編集パネルを開き、必要なモデルを選択します。この例では qwen-plus-2025-07-28(Qwen3) を選択し、思考モードを有効にします。

    Qwen-VL または QVQ モデルを使用する場合は、LLM ノードの Vision スイッチを有効にする必要があります:

    LLM ノード編集パネルの下部で Vision スイッチを見つけ、有効にします。ResolutionHigh または Low に設定できます。

  3. LLM ノードの実行

    Add message をクリックします。USER に対応するメッセージフィールドに質問「Who are you?」を入力し、ノード右上隅の実行ボタン 20251127203142 をクリックします。

    実行完了後、出力の text フィールドを確認します。思考プロセスは ... タグで囲まれ、その後にモデルの主要な応答が続きます。

    LLM ノードから返される text フィールドには、思考プロセスと応答の両方が含まれています。Dify のコード実行ノードと正規表現を使用して、これらを別々に抽出できます。

ナレッジベース

  1. ナレッジベースの作成

    ナレッジベース を作成・開きます。

  2. データソースの選択

    ナレッジベースファイルをアップロードします。

  3. テキストのセグメント化およびクリーニング

    Model Studio の埋め込みモデルおよび rerank モデルを構成します。この例では text-embedding-v4 および gte-rerank-v2 を使用します。必要に応じて他のパラメーターを調整してください。

    gte-rerank-v2 モデルは 中国 (北京) リージョン のみでサポートされています。
    multimodal-embedding-v1 モデルは現時点で埋め込みモデルとして選択できません。今後のアップデートにご期待ください。

よくある質問

Q1: TONGYI プラグインの API キーエラー

A: 主な原因は以下のとおりです。

  • プラグインの最新バージョンが不安定である可能性があります。以前のバージョンを試してください。

  • サブワークスペースの API キーを使用しています。TONGYI プラグインのバージョン 0.0.41 では、qwen-turbo モデルの呼び出し権限が検証されます。qwen-turbo呼び出し権限を付与する必要があります。

    TONGYI プラグインは Alibaba Cloud がメンテナンスしておらず、今後のバージョンで検証ポリシーが変更される可能性があります。デフォルトワークスペースの API キーを使用してください。
  • エンドポイント設定が誤っています。API キーのリージョンに基づいて、Use International Endpoint を正しく設定してください。

Q2: Qwen-Omniおよび Qwen-OCR モデルの使用方法

A: これらのモデルは Dify で直接構成できません。Chatflow またはワークフロー内の HTTP ノードを使用して統合できます。統合の詳細については、モデルのドキュメントに記載されている cURL コマンドの例をご参照ください。

HTTP ノードでのタイムアウトリスクを低減するため、API 呼び出しにはストリーミング出力を使用してください。

Q3: Wan モデルの使用方法

A: Dify には Wan モデル専用のプラグインは提供されていませんが、Dify の Chatflow またはワークフロー内のノードを使用して Text-to-Image および Text-to-Video 生成を実現できます。以下の手順に従ってください。

  1. ワークフローテンプレートのダウンロードおよびインポート

    事前に作成されたテンプレートのいずれかをダウンロードします:Wan - Text-to-Image Demo.yml または Wan - Text-to-Video Demo.ymlワークスペースImport DSL File をクリックし、ダウンロードしたテンプレートを選択します。

  2. 環境変数の構成

    ワークフローページで環境変数アイコン image.png を探し、DASHSCOPE_API_KEY の値をご利用の API キーに変更します。

  3. 出力のテスト

    実行 ボタンをクリックして出力を生成します。たとえば、Text-to-Image ワークフローで「a small cat」と入力すると、画像が生成されます。

    Text-to-Video ワークフローは、生成された動画の URL を返します。
    Text-to-Video 生成には通常、5 分以上かかります。
  4. ツールとして公開(オプション)

    これらの機能を他のアプリケーションで使用するには、右上隅の 公開 をクリックし、Publish as tool を選択します。

テンプレートは シンガポール リージョンのモデルを使用しています:wan2.2-t2i-flash(Text-to-Image)および wan2.1-t2v-turbo(Text-to-Video)。STEP1 ノードでモデルを変更し、STEP1 および STEP3 ノードでリージョン固有の API エンドポイントを修正できます。

Q4: Dify の非公開デプロイメント

A: Dify クラウドサービス には、最大 5 つのアプリケーションという制限事項などがあります。非公開デプロイメントについては、「Dify デプロイメントの Alibaba Cloud ソリューション」をご参照ください。