Dify は、AI アプリケーションを構築するためのオープンソースプラットフォームです。Alibaba Cloud Model Studio のモデル API を使用してアプリケーションを構築できます。
前提条件
API キーを取得し、Model Studio で必要なモデルサービスを有効化する必要があります。
1. モデルの設定
1.1. モデルプロバイダーのインストール
Dify Marketplace にアクセスします。モデル の下で Qwen を見つけ、最新バージョンのプラグインをインストールします。
-
TONGYI プラグインは Alibaba Cloud ではなく Dify がメンテナンスしています。最新バージョンのインストール時にエラーが発生した場合は、以前のバージョンを試してください。
-
Model Studio の DeepSeek モデルを使用するには、Qwen プラグインも併用する必要があります。
1.2. API キーの構成
ページの右上隅で、プロフィール画像 → 設定 をクリックします。モデルプロバイダー の下で、Qwen カードを見つけ、設定 をクリックします。
-
シンガポールリージョンのモデルを使用する場合、API-KEY Settings セクションに移動し、該当リージョンの API キーを入力して、Use International Endpoint を Yes に設定します。
-
北京リージョンのモデルを使用する場合、API-KEY Settings セクションに移動し、北京リージョンの API キーを入力して、Use International Endpoint を No に設定します。
構成中に Invalid API key provided エラーが表示された場合は、TONGYI プラグインの以前のバージョンをインストールしてみてください。

1.3. モデルの選択
Qwen カード上でクリックしてモデル一覧を表示し、必要なモデルのスイッチを有効にします。
プラグインに最新の Qwen モデルが含まれていない場合は、OpenAI-API-compatible プラグインをインストールできます。プラグイン設定で API endpoint URL を以下のいずれかに設定します:https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1(シンガポールリージョン)またはhttps://dashscope.aliyuncs.com/compatible-mode/v1(中国 (北京) リージョン)。WorkspaceIdは実際の ワークスペース ID を取得する に置き換えてください。
2. クイックスタート
Dify は複数のアプリケーションタイプをサポートしています。ご自身の用途に合わせて手順を選択してください。
チャットアシスタントおよびエージェント
-
チャットアシスタントまたはエージェントの作成
ワークスペース で Create blank app をクリックします。初心者向け の下でチャットアシスタントまたはエージェントを作成・開きます。
-
モデルの選択
アプリケーションページの右上隅でモデルを選択します。例として、Qwen の下で qwen-plus-latest(Qwen3) を選択し、思考モードを有効にします。
-
会話のテスト
「Who are you?」と入力します。モデルは思考プロセス完了後に応答します。
また、Qwen-VL または QVQ モデルを使用して画像に関する質問を行うこともできます。ビジョンモデルを選択すると、左側に Vision スイッチが表示されます。これを有効にすると、右側のチャットウィンドウで画像をアップロードできます。
Chatflow およびワークフロー
-
Chatflow またはワークフローの作成
ワークスペース で Chatflow またはワークフローを作成・開きます。
-
LLM ノードの追加
キャンバスに LLM ノードを追加します。ノードを選択して編集パネルを開き、必要なモデルを選択します。この例では qwen-plus-2025-07-28(Qwen3) を選択し、思考モードを有効にします。
Qwen-VL または QVQ モデルを使用する場合は、LLM ノードの Vision スイッチを有効にする必要があります:
LLM ノード編集パネルの下部で Vision スイッチを見つけ、有効にします。Resolution を High または Low に設定できます。
-
LLM ノードの実行
Add message をクリックします。USER に対応するメッセージフィールドに質問「Who are you?」を入力し、ノード右上隅の実行ボタン
をクリックします。実行完了後、出力の
textフィールドを確認します。思考プロセスは...タグで囲まれ、その後にモデルの主要な応答が続きます。LLM ノードから返される
textフィールドには、思考プロセスと応答の両方が含まれています。Dify のコード実行ノードと正規表現を使用して、これらを別々に抽出できます。
ナレッジベース
-
ナレッジベースの作成
ナレッジベース を作成・開きます。
-
データソースの選択
ナレッジベースファイルをアップロードします。
-
テキストのセグメント化およびクリーニング
Model Studio の埋め込みモデルおよび rerank モデルを構成します。この例では text-embedding-v4 および gte-rerank-v2 を使用します。必要に応じて他のパラメーターを調整してください。
gte-rerank-v2 モデルは 中国 (北京) リージョン のみでサポートされています。
multimodal-embedding-v1 モデルは現時点で埋め込みモデルとして選択できません。今後のアップデートにご期待ください。
よくある質問
Q1: TONGYI プラグインの API キーエラー
A: 主な原因は以下のとおりです。
-
プラグインの最新バージョンが不安定である可能性があります。以前のバージョンを試してください。
-
サブワークスペースの API キーを使用しています。TONGYI プラグインのバージョン
0.0.41では、qwen-turboモデルの呼び出し権限が検証されます。qwen-turboの呼び出し権限を付与する必要があります。TONGYI プラグインは Alibaba Cloud がメンテナンスしておらず、今後のバージョンで検証ポリシーが変更される可能性があります。デフォルトワークスペースの API キーを使用してください。
-
エンドポイント設定が誤っています。API キーのリージョンに基づいて、Use International Endpoint を正しく設定してください。
Q2: Qwen-Omniおよび Qwen-OCR モデルの使用方法
A: これらのモデルは Dify で直接構成できません。Chatflow またはワークフロー内の HTTP ノードを使用して統合できます。統合の詳細については、モデルのドキュメントに記載されている cURL コマンドの例をご参照ください。
HTTP ノードでのタイムアウトリスクを低減するため、API 呼び出しにはストリーミング出力を使用してください。
Q3: Wan モデルの使用方法
A: Dify には Wan モデル専用のプラグインは提供されていませんが、Dify の Chatflow またはワークフロー内のノードを使用して Text-to-Image および Text-to-Video 生成を実現できます。以下の手順に従ってください。
-
ワークフローテンプレートのダウンロードおよびインポート
事前に作成されたテンプレートのいずれかをダウンロードします:Wan - Text-to-Image Demo.yml または Wan - Text-to-Video Demo.yml。ワークスペース で Import DSL File をクリックし、ダウンロードしたテンプレートを選択します。
-
環境変数の構成
ワークフローページで環境変数アイコン
を探し、DASHSCOPE_API_KEYの値をご利用の API キーに変更します。 -
出力のテスト
実行 ボタンをクリックして出力を生成します。たとえば、Text-to-Image ワークフローで「a small cat」と入力すると、画像が生成されます。
Text-to-Video ワークフローは、生成された動画の URL を返します。
Text-to-Video 生成には通常、5 分以上かかります。
-
ツールとして公開(オプション)
これらの機能を他のアプリケーションで使用するには、右上隅の 公開 をクリックし、Publish as tool を選択します。
テンプレートは シンガポール リージョンのモデルを使用しています:wan2.2-t2i-flash(Text-to-Image)およびwan2.1-t2v-turbo(Text-to-Video)。STEP1 ノードでモデルを変更し、STEP1 および STEP3 ノードでリージョン固有の API エンドポイントを修正できます。
Q4: Dify の非公開デプロイメント
A: Dify クラウドサービス には、最大 5 つのアプリケーションという制限事項などがあります。非公開デプロイメントについては、「Dify デプロイメントの Alibaba Cloud ソリューション」をご参照ください。