すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:構造化出力

最終更新日:Mar 19, 2026

情報抽出や構造化データ生成タスクを実行する際、大規模言語モデル(LLM)が ```json のような余分なテキストを返す場合があります。これにより、後続の解析処理が失敗する可能性があります。構造化出力を使用することで、LLM が標準的な JSON 文字列を確実に返すようにできます。JSON スキーマモードでは、出力の構造およびデータ型を正確に制御できるため、追加の検証や再試行が不要になります。

使用方法

構造化出力は、JSON オブジェクトモードと JSON スキーマモードの 2 つのモードをサポートしています。

  • JSON オブジェクトモード:出力が標準的な JSON 文字列であることを保証しますが、特定の構造を保証するものではありません。このモードを使用するには、以下の手順を実行します。

  1. response_format を設定:リクエストボディで、response_format パラメーターを {"type": "json_object"} に設定します。

  2. プロンプトに JSON キーワードを含める:システムメッセージまたはユーザー・メッセージに「JSON」というキーワード(大文字小文字を区別しない)を含める必要があります。これを満たさない場合、モデルは次のエラーを返します:'messages' must contain the word 'json' in some form, to use 'response_format' of type 'json_object'.

  • JSON スキーマモード:出力が指定された構造に準拠することを保証します。このモードを使用するには、response_format パラメーターを {"type": "json_schema", "json_schema": {"strict": true, ...}} に設定します。

    説明

    プロンプトに JSON キーワードを含める必要はありません。

対応モデル

Qwen

  • テキスト生成モデル

    • Qwen Max シリーズ:qwen3-max、qwen3-max-2026-01-23(ノンシンキングモード)、qwen3-max-2025-09-23、qwen3-max-preview(ノンシンキングモード)、qwen-max、qwen-max-latest、qwen-max-2025-01-25 以降のスナップショットモデル

    • Qwen Plus シリーズ(ノンシンキングモード):qwen3.5-plus、qwen3.5-plus-2026-02-15、qwen-plus、qwen-plus-latest、qwen-plus-2024-12-20 以降のスナップショットモデル

    • Qwen Flash シリーズ(ノンシンキングモード):qwen3.5-flash、qwen3.5-flash-2026-02-23 以降のスナップショットモデル、qwen-flash、qwen-flash-2025-07-28 以降のスナップショットモデル

    • Qwen Turbo シリーズ(ノンシンキングモード):qwen-turbo、qwen-turbo-latest、qwen-turbo-2024-11-01 以降のスナップショットモデル

    • Qwen Coder シリーズ:qwen3-coder-plus、qwen3-coder-plus-2025-07-22、qwen3-coder-flash、qwen3-coder-flash-2025-07-28

    • Qwen Long シリーズ:qwen-long-latest、qwen-long-2025-01-25

  • オープンソーステキスト生成モデル

    • Qwen3.5(ノンシンキングモード):qwen3.5-397b-a17b、qwen3.5-122b-a10b、qwen3.5-27b、qwen3.5-35b-a3b

    • Qwen3(ノンシンキングモード)

    • Qwen3-Coder

    • Qwen2.5 シリーズのテキストモデル(数学およびコーダー向けモデルを除く)

  • マルチモーダルモデル

    • Qwen3-VL-Plus シリーズ(ノンシンキングモード):qwen3-vl-plus、qwen3-vl-plus-2025-09-23 以降のスナップショットモデル

    • Qwen3-VL-Flash シリーズ(ノンシンキングモード):qwen3-vl-flash、qwen3-vl-flash-2025-10-15 以降のスナップショットモデル

    • Qwen VL-Max シリーズ:qwen-vl-max(latest およびスナップショットモデルを除く)

    • Qwen VL-Plus シリーズ:qwen-vl-plus(latest およびスナップショットモデルを除く)

  • オープンソースマルチモーダルモデル

    • Qwen3-VL(ノンシンキングモード)

説明

思考モードのモデルは構造化出力をサポートしていません。

Kimi

kimi-k2-thinking

GLM

ノンシンキングモード:glm-5、glm-4.7、glm-4.6

モデルのコンテキストウィンドウ、課金情報、およびスナップショットバージョンについては、「モデル一覧」をご参照ください。

はじめに

この例では、個人プロファイルから情報を抽出します。

API キーの取得およびAPI キーを環境変数としてエクスポートを行います。OpenAI SDK または DashScope SDK を使用して呼び出しを行う場合は、SDK のインストールが必要です。

OpenAI 互換

Python

from openai import OpenAI
import os

client = OpenAI(
    # API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/zh/model-studio/get-api-key
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    # 北京リージョンのモデルを使用する場合は、base_url を https://dashscope.aliyuncs.com/compatible-mode/v1 に置き換えます。
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen-flash",
    messages=[
        {
            "role": "system",
            "content": "ユーザーの名前と年齢を抽出し、JSON 形式で返します"
        },
        {
            "role": "user",
            "content": "こんにちは、私の名前は田中一郎、34 歳です。メールアドレスは tanakaichiro@example.com で、バスケットボールと旅行が趣味です。", 
        },
    ],
    response_format={"type": "json_object"}
)

json_string = completion.choices[0].message.content
print(json_string)

応答

{
  "Name": "田中一郎",
  "Age": 34
}

Node.js

import OpenAI from "openai";

const openai = new OpenAI({
    // API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/zh/model-studio/get-api-key
    // 環境変数を設定していない場合は、次の行を apiKey: "sk-xxx" に置き換えます。
    apiKey: process.env.DASHSCOPE_API_KEY,
    // 北京リージョンのモデルを使用する場合は、baseURL を https://dashscope.aliyuncs.com/compatible-mode/v1 に置き換えます。
    baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
});

const completion = await openai.chat.completions.create({
    model: "qwen-flash",
    messages: [
        {
            role: "system",
            content: "ユーザーの名前と年齢を抽出し、JSON 形式で返します"
        },
        {
            role: "user",
            content: "こんにちは、私の名前は田中一郎、34 歳です。メールアドレスは tanakaichiro@example.com で、バスケットボールと旅行が趣味です。"
        }
    ],
    response_format: {
        type: "json_object"
    }
});

const jsonString = completion.choices[0].message.content;
console.log(jsonString);

応答

{
  "name": "Alex Brown",
  "age": 34
}

curl

# ======= 重要事項 =======
# API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/en/model-studio/get-api-key
# 北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions に置き換えます。
# === 実行前にこのコメントを削除してください ===
curl -X POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "qwen-plus",
    "messages": [
        {
            "role": "system",
            "content": "名前(文字列)、年齢(文字列)、メールアドレス(文字列)を抽出してください。結果を JSON 文字列として出力します。その他の関係のない内容は含めないでください。\n例:\nQ: 私の名前は張三、25 歳で、メールアドレスは zhangsan@example.com です。\nA: {\"name\":\"張三\",\"age\":\"25 歳\",\"email\":\"zhangsan@example.com\"}\nQ: 私の名前は李四、30 歳で、メールアドレスは lisi@example.com です。\nA: {\"name\":\"李四\",\"age\":\"30 歳\",\"email\":\"lisi@example.com\"}\nQ: 私の名前は王五、メールアドレスは wangwu@example.com、40 歳です。\nA: {\"name\":\"王五\",\"age\":\"40 歳\",\"email\":\"wangwu@example.com\"}"
        },
        {
            "role": "user", 
            "content": "こんにちは、私の名前は田中一郎、34 歳で、メールアドレスは tanakaichiro@example.com です。"
        }
    ],
    "response_format": {
        "type": "json_object"
    }
}'

応答

{
    "choices": [
        {
            "message": {
                "role": "assistant",
                "content": "{\"name\":\"田中一郎\",\"age\":\"34 歳\"}"
            },
            "finish_reason": "stop",
            "index": 0,
            "logprobs": null
        }
    ],
    "object": "chat.completion",
    "usage": {
        "prompt_tokens": 207,
        "completion_tokens": 20,
        "total_tokens": 227,
        "prompt_tokens_details": {
            "cached_tokens": 0
        }
    },
    "created": 1756455080,
    "system_fingerprint": null,
    "model": "qwen-plus",
    "id": "chatcmpl-624b665b-fb93-99e7-9ebd-bb6d86d314d2"
}

DashScope

Python

import os
import dashscope
# 北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えます。
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'

messages=[
    {
        "role": "system",
        "content": "ユーザーの名前と年齢を抽出し、JSON 形式で返します"
    },
    {
        "role": "user",
        "content": "こんにちは、私の名前は田中一郎、34 歳です。メールアドレスは tanakaichiro@example.com で、バスケットボールと旅行が趣味です。", 
    },
]
response = dashscope.Generation.call(
    # 環境変数を設定していない場合は、次の行を api_key="sk-xxx"(Alibaba Cloud Model Studio API キー)に置き換えます。
    api_key=os.getenv('DASHSCOPE_API_KEY'),
    model="qwen-flash", 
    messages=messages,
    result_format='message',
    response_format={'type': 'json_object'}
    )
json_string = response.output.choices[0].message.content
print(json_string)

応答

{
  "name": "Alex Brown",
  "age": 34
}

Java

DashScope Java SDK のバージョンは 2.18.4 以降である必要があります。

// DashScope Java SDK のバージョンは 2.18.4 以降である必要があります。

import java.util.Arrays;
import java.lang.System;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.common.ResponseFormat;
import com.alibaba.dashscope.protocol.Protocol;

public class Main {
    public static GenerationResult callWithMessage() throws ApiException, NoApiKeyException, InputRequiredException {
        // 北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えます。
        Generation gen = new Generation(Protocol.HTTP.getValue(), "https://dashscope-intl.aliyuncs.com/api/v1");
        Message systemMsg = Message.builder()
                .role(Role.SYSTEM.getValue())
                .content("ユーザーの名前と年齢を抽出し、JSON 形式で返します")
                .build();
        Message userMsg = Message.builder()
                .role(Role.USER.getValue())
                .content("こんにちは、私の名前は田中一郎、34 歳です。メールアドレスは tanakaichiro@example.com で、バスケットボールと旅行が趣味です。")
                .build();
        ResponseFormat jsonMode = ResponseFormat.builder().type("json_object").build();
        GenerationParam param = GenerationParam.builder()
                // 環境変数を設定していない場合は、次の行を .apiKey("sk-xxx")(Alibaba Cloud Model Studio API キー)に置き換えます。
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("qwen-flash")
                .messages(Arrays.asList(systemMsg, userMsg))
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .responseFormat(jsonMode)
                .build();
        return gen.call(param);
    }

    public static void main(String[] args) {
        try {
            GenerationResult result = callWithMessage();
            System.out.println(result.getOutput().getChoices().get(0).getMessage().getContent());
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            // ロギングフレームワークを使用して例外を記録します。
            System.err.println("生成サービスの呼び出し中にエラーが発生しました:" + e.getMessage());
        }
    }
}

応答

{
  "name": "田中一郎",
  "age": 34
}

curl

# ======= 重要な注意事項 =======
# 北京リージョンのモデルの場合、URL を次のように置き換えてください: https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# API キーはリージョンによって異なります。API キーの取得方法: https://www.alibabacloud.com/help/zh/model-studio/get-api-key
# === 実行前にこのコメントを削除してください ===

curl -X POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/text-generation/generation \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "qwen-flash",
    "input": {
        "messages": [
            {
                "role": "system",
                "content": "Extract the user's name and age, and return them in JSON format"
            },
            {
                "role": "user", 
                "content": "Hi everyone, my name is Alex Brown, I'm 34 years old, my email is alexbrown@example.com, and I enjoy playing basketball and traveling"
            }
        ]
    },
    "parameters": {
        "result_format": "message",
        "response_format": {
            "type": "json_object"
        }
    }
}'

応答

{
  "name": "田中一郎",
  "age": 34
}

画像および動画データ処理

テキストに加えて、マルチモーダルモデルは画像および動画に対する構造化出力をサポートしており、視覚情報の抽出、オブジェクトの位置特定、イベント検出が可能です。

画像および動画ファイルの制限については、「画像および動画理解」をご参照ください。

OpenAI 互換

Python

import os
from openai import OpenAI

client = OpenAI(
    # API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/zh/model-studio/get-api-key
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    # 北京リージョンのモデルを使用する場合は、base_url を https://dashscope.aliyuncs.com/compatible-mode/v1 に置き換えます。
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
)

completion = client.chat.completions.create(
    model="qwen3-vl-plus",
    messages=[
        {
            "role": "system",
            "content": [{"type": "text", "text": "あなたは親切なアシスタントです。"}],
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "http://duguang-labelling.oss-cn-shanghai.aliyuncs.com/demo_ocr/receipt_zh_demo.jpg"
                    },
                },
                {"type": "text", "text": "画像からチケット情報(配列型:travel_date、trains、seat_num、arrival_site、price)および請求書情報(配列型:invoice_code、invoice_number)を抽出し、両方の配列を含む JSON を出力します。"},
            ],
        },
    ],
    response_format={"type": "json_object"}
)
json_string = completion.choices[0].message.content
print(json_string)

応答

{
  "ticket": [
    {
      "travel_date": "2013-06-29",
      "trains": "stream",
      "seat_num": "371",
      "arrival_site": "Development Zone",
      "price": "8.00"
    }
  ],
  "invoice": [
    {
      "invoice_code": "221021325353",
      "invoice_number": "10283819"
    }
  ]
}

Node.js

import OpenAI from "openai";

const openai = new OpenAI({
  // API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/zh/model-studio/get-api-key
  // 環境変数を設定していない場合は、次の行を apiKey: "sk-xxx"(Model Studio API キー)に置き換えます。
  apiKey: process.env.DASHSCOPE_API_KEY,
  // 北京リージョンのモデルを使用する場合は、base_url を https://dashscope.aliyuncs.com/compatible-mode/v1 に置き換えます。
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
});

async function main() {
  const response = await openai.chat.completions.create({
    model: "qwen3-vl-plus",
    messages: [{
        role: "system",
        content: [{
          type: "text",
          text: "あなたは親切なアシスタントです。"
        }]
      },
      {
        role: "user",
        content: [{
            type: "image_url",
            image_url: {
              "url": "http://duguang-labelling.oss-cn-shanghai.aliyuncs.com/demo_ocr/receipt_zh_demo.jpg"
            }
          },
          {
            type: "text",
            text: "画像からチケット情報(配列型:travel_date、trains、seat_num、arrival_site、price)および請求書情報(配列型:invoice_code、invoice_number)を抽出し、両方の配列を含む JSON を出力します。"
          }
        ]
      }
    ],
    response_format: {type: "json_object"}
  });
  console.log(response.choices[0].message.content);
}

main()

応答

{
  "ticket": [
    {
      "travel_date": "2013-06-29",
      "trains": "stream",
      "seat_num": "371",
      "arrival_site": "Development Zone",
      "price": "8.00"
    }
  ],
  "invoice": [
    {
      "invoice_code": "221021325353",
      "invoice_number": "10283819"
    }
  ]
}

curl

# ======= 重要事項 =======
# 北京リージョンのモデルを使用する場合は、base_url を https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions に置き換えます。
# API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/zh/model-studio/get-api-key
# === 実行前にこのコメントを削除してください ===

curl --location 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
  "model": "qwen3-vl-plus",
  "messages": [
  {"role":"system",
  "content":[
    {"type": "text", "text": "あなたは親切なアシスタントです。"}]},
  {
    "role": "user",
    "content": [
      {"type": "image_url", "image_url": {"url": "http://duguang-labelling.oss-cn-shanghai.aliyuncs.com/demo_ocr/receipt_zh_demo.jpg"}},
      {"type": "text", "text": "画像からチケット情報(配列型:travel_date、trains、seat_num、arrival_site、price)および請求書情報(配列型:invoice_code、invoice_number)を抽出し、両方の配列を含む JSON を出力します。"}
    ]
  }],
  "response_format":{"type": "json_object"}
}'

応答

{
  "ticket": [
    {
      "travel_date": "2013-06-29",
      "trains": "stream",
      "seat_num": "371",
      "arrival_site": "Development Zone",
      "price": "8.00"
    }
  ],
  "invoice": [
    {
      "invoice_code": "221021325353",
      "invoice_number": "10283819"
    }
  ]
}

DashScope

Python

import os
import dashscope

# 北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えます。
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'

messages = [
{
    "role": "system",
    "content": [
    {"text": "あなたは親切なアシスタントです。"}]
},
{
    "role": "user",
    "content": [
    {"image": "http://duguang-labelling.oss-cn-shanghai.aliyuncs.com/demo_ocr/receipt_zh_demo.jpg"},
    {"text": "画像からチケット情報(配列型:travel_date、trains、seat_num、arrival_site、price)および請求書情報(配列型:invoice_code、invoice_number)を抽出し、両方の配列を含む JSON を出力します。"}]
}]
response = dashscope.MultiModalConversation.call(
    # 環境変数を設定していない場合は、次の行を api_key ="sk-xxx"(Model Studio API キー)に置き換えます。
    api_key = os.getenv('DASHSCOPE_API_KEY'),
    model = 'qwen3-vl-plus',
    messages = messages,
    response_format={'type': 'json_object'}
)
json_string = response.output.choices[0].message.content[0]["text"]
print(json_string)

応答

{
  "ticket": [
    {
      "travel_date": "2013-06-29",
      "trains": "Liushui",
      "seat_num": "371",
      "arrival_site": "Development Zone",
      "price": "8.00"
    }
  ],
  "invoice": [
    {
      "invoice_code": "221021325353",
      "invoice_number": "10283819"
    }
  ]
}

Java

// DashScope Java SDK のバージョンは 2.21.4 以降である必要があります。

import java.util.Arrays;
import java.util.Collections;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversation;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationParam;
import com.alibaba.dashscope.aigc.multimodalconversation.MultiModalConversationResult;
import com.alibaba.dashscope.common.MultiModalMessage;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.exception.UploadFileException;
import com.alibaba.dashscope.common.ResponseFormat;
import com.alibaba.dashscope.utils.Constants;

public class Main {
    
    // 北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換えます。
    static {
        Constants.baseHttpApiUrl="https://dashscope-intl.aliyuncs.com/api/v1";
    }
    public static void simpleMultiModalConversationCall()
            throws ApiException, NoApiKeyException, UploadFileException {
        MultiModalConversation conv = new MultiModalConversation();
        MultiModalMessage systemMessage = MultiModalMessage.builder().role(Role.SYSTEM.getValue())
                .content(Arrays.asList(
                        Collections.singletonMap("text", "あなたは親切なアシスタントです。"))).build();
        MultiModalMessage userMessage = MultiModalMessage.builder().role(Role.USER.getValue())
                .content(Arrays.asList(
                        Collections.singletonMap("image", "http://duguang-labelling.oss-cn-shanghai.aliyuncs.com/demo_ocr/receipt_zh_demo.jpg"),
                        Collections.singletonMap("text", "画像からチケット情報(配列型:travel_date、trains、seat_num、arrival_site、price)および請求書情報(配列型:invoice_code、invoice_number)を抽出し、両方の配列を含む JSON を出力します。"))).build();
        ResponseFormat jsonMode = ResponseFormat.builder().type("json_object").build();
        MultiModalConversationParam param = MultiModalConversationParam.builder()
                // 環境変数を設定していない場合は、次の行を .apiKey("sk-xxx")(Model Studio API キー)に置き換えます。
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("qwen3-vl-plus")
                .messages(Arrays.asList(systemMessage, userMessage))
                .responseFormat(jsonMode)
                .build();
        MultiModalConversationResult result = conv.call(param);
        System.out.println(result.getOutput().getChoices().get(0).getMessage().getContent().get(0).get("text"));
    }
    public static void main(String[] args) {
        try {
            simpleMultiModalConversationCall();
        } catch (ApiException | NoApiKeyException | UploadFileException e) {
            System.out.println(e.getMessage());
        }
    }
}

応答

{
  "ticket": [
    {
      "travel_date": "2013-06-29",
      "trains": "stream",
      "seat_num": "371",
      "arrival_site": "Development Zone",
      "price": "8.00"
    }
  ],
  "invoice": [
    {
      "invoice_code": "221021325353",
      "invoice_number": "10283819"
    }
  ]
}

curl

# ======= 重要事項 =======
# 北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation に置き換えます。
# API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/zh/model-studio/get-api-key
# === 実行前にこのコメントを削除してください ===

curl -X POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
    "model": "qwen3-vl-plus",
    "input": {
        "messages": [
            {
                "role": "system",
                "content": [
                    {
                        "text": "あなたは親切なアシスタントです。"
                    }
                ]
            },
            {
                "role": "user",
                "content": [
                    {
                        "image": "http://duguang-labelling.oss-cn-shanghai.aliyuncs.com/demo_ocr/receipt_zh_demo.jpg"
                    },
                    {
                        "text": "画像からチケット情報(配列型:travel_date、trains、seat_num、arrival_site、price)および請求書情報(配列型:invoice_code、invoice_number)を抽出し、両方の配列を含む JSON を出力します。"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "response_format": {
            "type": "json_object"
        }
    }
}'

応答

{
  "output": {
    "choices": [
      {
        "message": {
          "content": [
            {
              "text": "{\n  \"ticket\": [\n    {\n      \"travel_date\": \"2013-06-29\",\n      \"trains\": \"train number\",\n      \"seat_num\": \"371\",\n      \"arrival_site\": \"Development Zone\",\n      \"price\": \"8.00\"\n    }\n  ],\n  \"invoice\": [\n    {\n      \"invoice_code\": \"221021325353\",\n      \"invoice_number\": \"10283819\"\n    }\n  ]\n}"
            }
          ],
          "role": "assistant"
        },
        "finish_reason": "stop"
      }
    ]
  },
  "usage": {
    "total_tokens": 598,
    "input_tokens_details": {
      "image_tokens": 418,
      "text_tokens": 68
    },
    "output_tokens": 112,
    "input_tokens": 486,
    "output_tokens_details": {
      "text_tokens": 112
    },
    "image_tokens": 418
  },
  "request_id": "b129dce1-0d5d-4772-b8b5-bd3a1d5cde63"
}

プロンプトの最適化

曖昧なプロンプト(例:「ユーザー情報を返す」)は、モデルが予期しない結果を生成する原因となります。期待されるスキーマを正確にプロンプトに記述してください。具体的には、フィールドの型、必須/任意の状態、フォーマット要件(例:日付フォーマット)、および例を含めて記述します。

OpenAI 互換

Python

from openai import OpenAI
import os
import json
import textwrap  # 複数行文字列のインデント処理およびコードの可読性向上に使用

# モデルに期待される出力フォーマットを示すために、事前に例の応答を定義します
# 例 1:すべてのフィールドを含む完全な応答
example1_response = json.dumps(
    {
        "info": {"name": "山田太郎", "age": "25 歳", "email": "yamadataro@example.com"},
        "hobby": ["歌うこと"]
    },
    ensure_ascii=False
)
# 例 2:複数の趣味を含む応答
example2_response = json.dumps(
    {
        "info": {"name": "佐藤花子", "age": "30 歳", "email": "satohanako@example.com"},
        "hobby": ["踊ること", "泳ぐこと"]
    },
    ensure_ascii=False
)
# 例 3:趣味フィールドを含まない応答(趣味は任意)
example3_response = json.dumps(
    {
        "info": {"name": "鈴木一郎", "age": "28 歳", "email": "suzukichiro@example.com"}
    },
    ensure_ascii=False
)
# 例 4:趣味フィールドを含まない別の応答
example4_response = json.dumps(
    {
        "info": {"name": "高橋次郎", "age": "35 歳", "email": "takahashijiro@example.com"}
    },
    ensure_ascii=False
)

# OpenAI クライアントを初期化します
client = OpenAI(
    # 環境変数を設定していない場合は、次の行を api_key="sk-xxx" に置き換えます
    # API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/en/model-studio/get-api-key
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    # 以下は北京リージョンの base_url です。シンガポールリージョンのモデルを使用する場合は、base_url を https://dashscope-intl.aliyuncs.com/compatible-mode/v1 に置き換えます
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

# dedent は各行の共通の先頭空白を削除し、コード内で文字列を読みやすくインデントしても、実行時に余分な空白が含まれないようにします
system_prompt = textwrap.dedent(f"""\
    ユーザー入力から個人情報を抽出し、指定された JSON スキーマ形式で出力してください:

    [出力フォーマット要件]
    出力は、以下の JSON 構造に厳密に従う必要があります:
    {{
      "info": {{
        "name": "文字列型、必須フィールド、ユーザーの氏名",
        "age": "文字列型、必須フィールド、フォーマットは '数字 歳'(例:'25 歳')",
        "email": "文字列型、必須フィールド、標準的なメールアドレス形式(例:'user@example.com')"
      }},
      "hobby": ["文字列配列型、任意フィールド、ユーザーのすべての趣味を含む。趣味が言及されていない場合は、このフィールドを完全に除外"]
    }}

    [フィールド抽出ルール]
    1. name:テキストからユーザーの氏名を特定、必須
    2. age:年齢情報を特定し、「数字 歳」フォーマットに変換、必須
    3. email:メールアドレスを特定し、元の形式を保持、必須
    4. hobby:ユーザーの趣味を特定し、文字列配列として出力;趣味が言及されていない場合は、hobby フィールドを完全に除外

    [参考例]
    例 1(趣味あり):
    Q: 私の名前は山田太郎、25 歳で、メールアドレスは yamadataro@example.com、趣味は歌うことです
    A: {example1_response}

    例 2(複数の趣味あり):
    Q: 私の名前は佐藤花子、30 歳で、メールアドレスは satohanako@example.com、趣味は踊ることと泳ぐことです
    A: {example2_response}

    例 3(趣味なし):
    Q: 私の名前は鈴木一郎、28 歳で、メールアドレスは suzukichiro@example.com
    A: {example3_response}

    例 4(趣味なし):
    Q: 私は高橋次郎、35 歳で、メールアドレスは takahashijiro@example.com
    A: {example4_response}

    上記のフォーマットおよびルールに厳密に従って情報を抽出し、JSON を出力してください。ユーザーが趣味について言及していない場合は、hobby フィールドを出力に含めないでください。\
""")

# LLM API を呼び出して情報抽出を行います
completion = client.chat.completions.create(
    model="qwen-plus",
    messages=[
        {
            "role": "system",
            "content": system_prompt
        },
        {
            "role": "user",
            "content": "こんにちは、私の名前は佐々木健太、34 歳で、メールアドレスは sasaki-kenta@example.com、趣味はバスケットボールと旅行です。", 
        },
    ],
    response_format={"type": "json_object"},  # JSON 形式での返答を指定
)

# モデルによって生成された JSON 結果を抽出して表示します
json_string = completion.choices[0].message.content
print(json_string)

応答

{
  "info": {
    "name": "Alex Brown",
    "age": "34 years old",
    "email": "alexbrown@example.com"
  },
  "hobby": ["Basketball", "Traveling"]  
}

Node.js

import OpenAI from "openai";

// 事前に定義した例の応答(モデルに期待される出力フォーマットを示すため)
// 例 1:すべてのフィールドを含む完全な応答
const example1Response = JSON.stringify({
    info: { name: "山田太郎", age: "25 歳", email: "yamadataro@example.com" },
    hobby: ["歌うこと"]
}, null, 2);

// 例 2:複数の趣味を含む応答
const example2Response = JSON.stringify({
    info: { name: "佐藤花子", age: "30 歳", email: "satohanako@example.com" },
    hobby: ["踊ること", "泳ぐこと"]
}, null, 2);

// 例 3:趣味フィールドを含まない応答(趣味は任意)
const example3Response = JSON.stringify({
    info: { name: "鈴木一郎", age: "28 歳", email: "suzukichiro@example.com" }
}, null, 2);

// 例 4:趣味フィールドを含まない別の応答
const example4Response = JSON.stringify({
    info: { name: "高橋次郎", age: "35 歳", email: "takahashijiro@example.com" }
}, null, 2);

// OpenAI クライアントの設定を初期化
const openai = new OpenAI({
    // 環境変数を設定していない場合は、次の行を apiKey: "sk-xxx"(Alibaba Cloud Model Studio API キー)に置き換えます
    // API キーはリージョンによって異なります。API キーの取得方法:https://www.alibabacloud.com/help/en/model-studio/get-api-key
    apiKey: process.env.DASHSCOPE_API_KEY,
    // 以下は北京リージョンの base_url です。シンガポールリージョンのモデルを使用する場合は、base_url を https://dashscope-intl.aliyuncs.com/compatible-mode/v1 に置き換えます
    baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1"
});

// 構造化されたプロンプトを使用してチャット完了リクエストを作成し、出力の精度を向上させます
const completion = await openai.chat.completions.create({
    model: "qwen-plus",
    messages: [
        {
            role: "system",
            content: `ユーザー入力から個人情報を抽出し、指定された JSON スキーマ形式で出力してください:

[出力フォーマット要件]
出力は、以下の JSON 構造に厳密に従う必要があります:
{
  "info": {
    "name": "文字列型、必須フィールド、ユーザーの氏名",
    "age": "文字列型、必須フィールド、フォーマットは '数字 歳'(例:'25 歳')",
    "email": "文字列型、必須フィールド、標準的なメールアドレス形式(例:'user@example.com')"
  },
  "hobby": ["文字列配列型、任意フィールド、ユーザーのすべての趣味を含む。趣味が言及されていない場合は、このフィールドを完全に除外"]
}

[フィールド抽出ルール]
1. name:テキストからユーザーの氏名を特定、必須
2. age:年齢情報を特定し、「数字 歳」フォーマットに変換、必須
3. email:メールアドレスを特定し、元の形式を保持、必須
4. hobby:ユーザーの趣味を特定し、文字列配列として出力;趣味が言及されていない場合は、hobby フィールドを完全に除外

[参考例]
例 1(趣味あり):
Q: 私の名前は山田太郎、25 歳で、メールアドレスは yamadataro@example.com、趣味は歌うことです
A: ${example1Response}

例 2(複数の趣味あり):
Q: 私の名前は佐藤花子、30 歳で、メールアドレスは satohanako@example.com、趣味は踊ることと泳ぐことです
A: ${example2Response}

例 3(趣味なし):
Q: 私の名前は鈴木一郎、28 歳で、メールアドレスは suzukichiro@example.com
A: ${example3Response}

例 4(趣味なし):
Q: 私は高橋次郎、35 歳で、メールアドレスは takahashijiro@example.com
A: ${example4Response}

上記のフォーマットおよびルールに厳密に従って情報を抽出し、JSON を出力してください。ユーザーが趣味について言及していない場合は、hobby フィールドを出力に含めないでください。`
        },
        {
            role: "user",
            content: "こんにちは、私の名前は佐々木健太、34 歳で、メールアドレスは sasaki-kenta@example.com、趣味はバスケットボールと旅行です。"
        }
    ],
    response_format: {
        type: "json_object"
    }
});

// モデルによって生成された JSON 結果を抽出して表示します
const jsonString = completion.choices[0].message.content;
console.log(jsonString);

応答

{
  "info": {
    "name": "アレックス・ブラウン",
    "age": "34歳",
    "email": "alexbrown@example.com"
  },
  "hobby": [
    "バスケットボール",
    "旅行"
  ]
}

DashScope

Python

import os
import json
import dashscope

# シンガポールリージョンのモデルを使用する場合は、次の行のコメントを解除します
# dashscope.base_http_api_url = "https://dashscope-intl.aliyuncs.com/api/v1"

# 事前に定義した例の応答(モデルに期待される出力フォーマットを示すため)
example1_response = json.dumps(
    {
        "info": {"name": "山田太郎", "age": "25 歳", "email": "yamadataro@example.com"},
        "hobby": ["歌うこと"]
    },
    ensure_ascii=False
)
example2_response = json.dumps(
    {
        "info": {"name": "佐藤花子", "age": "30 歳", "email": "satohanako@example.com"},
        "hobby": ["踊ること", "泳ぐこと"]
    },
    ensure_ascii=False
)
example3_response = json.dumps(
    {
        "info": {"name": "鈴木一郎", "age": "40 歳", "email": "suzukichiro@example.com"},
        "hobby": ["ラップ", "バスケットボール"]
    },
    ensure_ascii=False
)

messages=[
        {
            "role": "system",
            "content": f"""ユーザー入力から個人情報を抽出し、指定された JSON スキーマ形式で出力してください:

[出力フォーマット要件]
出力は、以下の JSON 構造に厳密に従う必要があります:
{{
  "info": {{
    "name": "文字列型、必須フィールド、ユーザーの氏名",
    "age": "文字列型、必須フィールド、フォーマットは '数字 歳'(例:'25 歳')",
    "email": "文字列型、必須フィールド、標準的なメールアドレス形式(例:'user@example.com')"
  }},
  "hobby": ["文字列配列型、任意フィールド、ユーザーのすべての趣味を含む。趣味が言及されていない場合は、このフィールドを完全に除外"]
}}

[フィールド抽出ルール]
1. name:テキストからユーザーの氏名を特定、必須
2. age:年齢情報を特定し、「数字 歳」フォーマットに変換、必須
3. email:メールアドレスを特定し、元の形式を保持、必須
4. hobby:ユーザーの趣味を特定し、文字列配列として出力;趣味が言及されていない場合は、hobby フィールドを完全に除外

[参考例]
例 1(趣味あり):
Q: 私の名前は山田太郎、25 歳で、メールアドレスは yamadataro@example.com、趣味は歌うことです
A: {example1_response}

例 2(複数の趣味あり):
Q: 私の名前は佐藤花子、30 歳で、メールアドレスは satohanako@example.com、趣味は踊ることと泳ぐことです
A: {example2_response}

例 3(複数の趣味あり):
Q: メールアドレスは suzukichiro@example.com、40 歳で、私の名前は鈴木一郎、趣味はラップとバスケットボールです
A: {example3_response}

上記のフォーマットおよびルールに厳密に従って情報を抽出し、JSON を出力してください。ユーザーが趣味について言及していない場合は、hobby フィールドを出力に含めないでください。"""
        },
        {
            "role": "user",
            "content": "こんにちは、私の名前は佐々木健太、34 歳で、メールアドレスは sasaki-kenta@example.com、趣味はバスケットボールと旅行です。", 
        },
    ]
response = dashscope.Generation.call(
    # 環境変数を設定していない場合は、次の行を api_key="sk-xxx"(Alibaba Cloud Model Studio API キー)に置き換えます
    api_key=os.getenv('DASHSCOPE_API_KEY'),
    model="qwen-plus", 
    messages=messages,
    result_format='message',
    response_format={'type': 'json_object'}
    )
json_string = response.output.choices[0].message.content
print(json_string)

応答

{
  "info": {
    "name": "Alex Brown",
    "age": "34 years old",
    "email": "alexbrown@example.com"
  },
  "hobby": [
    "playing basketball",
    "traveling"
  ]
}

Java

import java.util.Arrays;
import java.lang.System;
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.common.ResponseFormat;
import com.alibaba.dashscope.protocol.Protocol;

public class Main {
    public static GenerationResult callWithMessage() throws ApiException, NoApiKeyException, InputRequiredException {
        // 北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1 に置き換える必要があります。
        Generation gen = new Generation(Protocol.HTTP.getValue(), "https://dashscope-intl.aliyuncs.com/api/v1");
        Message systemMsg = Message.builder()
                .role(Role.SYSTEM.getValue())
                .content("""
                ユーザー入力から個人情報を抽出し、指定された JSON スキーマ形式で出力してください:

[出力フォーマット要件]
出力は、以下の JSON 構造に厳密に従う必要があります:
{
  "info": {
    "name": "文字列型、必須フィールド、ユーザーの氏名",
    "age": "文字列型、必須フィールド、フォーマットは '数字 歳'(例:'25 歳')",
    "email": "文字列型、必須フィールド、標準的なメールアドレス形式(例:'user@example.com')"
  },
  "hobby": ["文字列配列型、任意フィールド、ユーザーのすべての趣味を含む。趣味が言及されていない場合は、このフィールドを出力から完全に除外してください。"]
}

[フィールド抽出ルール]
1. name:テキストからユーザーの氏名を特定します。このフィールドは必須です。
2. age:年齢情報を特定し、「数字 歳」フォーマットに変換します。このフィールドは必須です。
3. email:メールアドレスを特定し、元の形式を保持します。このフィールドは必須です。
4. hobby:ユーザーの趣味を特定し、文字列の配列として出力します。趣味が言及されていない場合は、hobby フィールドを完全に除外してください。

[例]
例 1(趣味あり):
Q: 私の名前は山田太郎、25 歳で、メールアドレスは yamadataro@example.com、趣味は歌うことです。
A: {"info":{"name":"山田太郎","age":"25 歳","email":"yamadataro@example.com"},"hobby":["歌うこと"]}

例 2(複数の趣味あり):
Q: 私の名前は佐藤花子、30 歳で、メールアドレスは satohanako@example.com、趣味は踊ることと泳ぐことです。
A: {"info":{"name":"佐藤花子","age":"30 歳","email":"satohanako@example.com"},"hobby":["踊ること","泳ぐこと"]}

例 3(趣味なし):
Q: 私の名前は鈴木一郎、メールアドレスは suzukichiro@example.com、40 歳です。
A: {"info":{"name":"鈴木一郎","age":"40 歳","email":"suzukichiro@example.com"}}""")
                .build();
        Message userMsg = Message.builder()
                .role(Role.USER.getValue())
                .content("こんにちは、私の名前は佐々木健太、34 歳で、メールアドレスは sasaki-kenta@example.com、趣味はバスケットボールと旅行です。")
                .build();
        ResponseFormat jsonMode = ResponseFormat.builder().type("json_object").build();
        GenerationParam param = GenerationParam.builder()
                // 北京リージョンのモデルを使用する場合は、北京リージョン用の API キーが必要です。キーの取得方法:https://bailian.console.alibabacloud.com/?tab=model#/api-key
                // 環境変数を設定していない場合は、次の行を .apiKey("sk-xxx")(Alibaba Cloud Model Studio API キー)に置き換えます。
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("qwen-plus")
                .messages(Arrays.asList(systemMsg, userMsg))
                .resultFormat(GenerationParam.ResultFormat.MESSAGE)
                .responseFormat(jsonMode)
                .build();
        return gen.call(param);
    }
    public static void main(String[] args) {
        try {
            GenerationResult result = callWithMessage();
            System.out.println(result.getOutput().getChoices().get(0).getMessage().getContent());
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            // ロギングフレームワークを使用して例外を記録します。
            System.err.println("生成サービスの呼び出し中にエラーが発生しました:" + e.getMessage());
        }
    }
}

応答

{
  "info": {
    "name": "Alex Brown",
    "age": "34 years old",
    "email": "alexbrown@example.com"
  },
  "hobby": [
    "Playing basketball",
    "Traveling"
  ]
}

本番環境への適用

  • 検証

    出力をダウンストリームサービスに渡す前に、jsonschema(Python)、Ajv(JavaScript)、Everit(Java)などのツールで検証を行ってください。これにより、欠落フィールド、型エラー、フォーマット不備による解析失敗を防止できます。検証に失敗した場合は、再試行または LLM を使用した出力の再作成を行ってください。

  • max_tokens の無効化

    構造化出力を有効化している場合、max_tokens を設定しないでください。このパラメーターは出力トークン数を制限し、デフォルトではモデルの最大値になります。設定すると、JSON 文字列が途中で切り捨てられ、解析失敗を引き起こす可能性があります。

よくある質問

Q:Qwen の思考モードモデルは、どのように構造化出力を生成しますか?

A:Qwen の思考モードモデルは構造化出力をサポートしていません。思考モードで標準的な JSON 文字列を取得するには、JSON モードをサポートするモデルを使用して、JSON 解析に失敗した場合に出力を修正します。

  1. 思考モードからの出力取得

    高品質な出力を得るために思考モードモデルを呼び出しますが、これは標準的な JSON 文字列ではない場合があります。

    思考モードを有効化する際に、response_format パラメーターを {"type": "json_object"} に設定しないでください。そうするとエラーが発生します。
    completion = client.chat.completions.create(
        model="qwen-plus",
        messages=[
            {"role": "system", "content": system_prompt},
            {
                "role": "user",
                "content": "こんにちは、私の名前は佐々木健太、34 歳で、メールアドレスは sasaki-kenta@example.com、趣味はバスケットボールと旅行です。",
            },
        ],
        # 思考モードを有効化します。JSON パースに失敗した場合に備えて、response_format パラメーターを {"type": "json_object"} に設定しないでください。設定するとエラーになります。
        extra_body={"enable_thinking": True},
        # 思考モードではストリーミング出力が必須です。
        stream=True
    )
    # モデルによって生成された JSON 結果を抽出して表示します。
    json_string = ""
    for chunk in completion:
        if chunk.choices[0].delta.content is not None:
            json_string += chunk.choices[0].delta.content
  2. 出力の検証および修正

    前のステップで生成された json_string を解析してみてください:

    • モデルが標準的な JSON 文字列を生成した場合は、そのまま解析して返します。

    • モデルが非標準の JSON 文字列を生成した場合は、構造化出力をサポートするモデル(例:ノンシンキングモードの高速・低コストモデル qwen-flash)を呼び出して、フォーマットを修正します。

    import json
    from openai import OpenAI
    import os
    
    # OpenAI クライアントを初期化します(前のコードブロックで client 変数が定義されていない場合は、次の行のコメントを解除します)。
    # client = OpenAI(
    #     api_key=os.getenv("DASHSCOPE_API_KEY"),
    #     base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    # )
    
    try:
        json_object_from_thinking_model = json.loads(json_string)
        print("標準的な JSON 文字列を生成しました")
    except json.JSONDecodeError:
        print("標準的な JSON 文字列を生成できませんでした。構造化出力をサポートするモデルで修正します")
        completion = client.chat.completions.create(
            model="qwen-flash",
            messages=[
                {
                    "role": "system",
                    "content": "あなたは JSON フォーマットの専門家です。ユーザーの JSON 文字列を標準フォーマットに修正してください。",
                },
                {
                    "role": "user",
                    "content": json_string,
                },
            ],
            response_format={"type": "json_object"},
        )
        json_object_from_thinking_model = json.loads(completion.choices[0].message.content)

エラーコード

モデル呼び出しが失敗し、エラーメッセージが返された場合は、「エラーメッセージ」をご参照ください。