リクエストボディ | cURL# ======= 重要 =======
# 以下の URL はシンガポールリージョン用です。北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/audio/asr/transcription に置き換えてください。
# シンガポールリージョンと北京リージョンの API キーは異なります。API キーを取得するには、https://www.alibabacloud.com/help/model-studio/get-api-key をご参照ください。
# === 実行前にこのコメントを削除してください ===
curl --location --request POST 'https://dashscope-intl.aliyuncs.com/api/v1/services/audio/asr/transcription' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--header "X-DashScope-Async: enable" \
--data '{
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id":[
0
],
"enable_itn": false
}
}'
Javaimport com.google.gson.Gson;
import com.google.gson.annotations.SerializedName;
import okhttp3.*;
import java.io.IOException;
public class Main {
// 以下の URL はシンガポールリージョン用です。北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/audio/asr/transcription に置き換えてください。
private static final String API_URL = "https://dashscope-intl.aliyuncs.com/api/v1/services/audio/asr/transcription";
public static void main(String[] args) {
// シンガポールリージョンと北京リージョンの API キーは異なります。API キーを取得するには、https://www.alibabacloud.com/help/model-studio/get-api-key をご参照ください。
// 環境変数が設定されていない場合は、次の行を String apiKey = "sk-xxx" に置き換えて、ご利用の Model Studio API キーを使用してください。
String apiKey = System.getenv("DASHSCOPE_API_KEY");
OkHttpClient client = new OkHttpClient();
Gson gson = new Gson();
/*String payloadJson = """
{
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id": [0],
"enable_itn": false,
"language": "zh",
"corpus": {
"text": ""
}
}
}
""";*/
String payloadJson = """
{
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id": [0],
"enable_itn": false
}
}
""";
RequestBody body = RequestBody.create(payloadJson, MediaType.get("application/json; charset=utf-8"));
Request request = new Request.Builder()
.url(API_URL)
.addHeader("Authorization", "Bearer " + apiKey)
.addHeader("Content-Type", "application/json")
.addHeader("X-DashScope-Async", "enable")
.post(body)
.build();
try (Response response = client.newCall(request).execute()) {
if (response.isSuccessful() && response.body() != null) {
String respBody = response.body().string();
// Gson で JSON を解析
ApiResponse apiResp = gson.fromJson(respBody, ApiResponse.class);
if (apiResp.output != null) {
System.out.println("task_id: " + apiResp.output.taskId);
} else {
System.out.println(respBody);
}
} else {
System.out.println("task failed! HTTP code: " + response.code());
if (response.body() != null) {
System.out.println(response.body().string());
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
static class ApiResponse {
@SerializedName("request_id")
String requestId;
Output output;
}
static class Output {
@SerializedName("task_id")
String taskId;
@SerializedName("task_status")
String taskStatus;
}
}
Pythonimport requests
import json
import os
# 以下の URL はシンガポールリージョン用です。北京リージョンのモデルを使用する場合は、URL を https://dashscope.aliyuncs.com/api/v1/services/audio/asr/transcription に置き換えてください。
url = "https://dashscope-intl.aliyuncs.com/api/v1/services/audio/asr/transcription"
# シンガポールリージョンと北京リージョンの API キーは異なります。API キーを取得するには、https://www.alibabacloud.com/help/model-studio/get-api-key をご参照ください。
# 環境変数が設定されていない場合は、次の行を DASHSCOPE_API_KEY = "sk-xxx" に置き換えて、ご利用の Model Studio API キーを使用してください。
DASHSCOPE_API_KEY = os.getenv("DASHSCOPE_API_KEY")
headers = {
"Authorization": f"Bearer {DASHSCOPE_API_KEY}",
"Content-Type": "application/json",
"X-DashScope-Async": "enable"
}
payload = {
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id": [0],
# "language": "zh",
"enable_itn": False
# "corpus": {
# "text": ""
# }
}
}
response = requests.post(url, headers=headers, data=json.dumps(payload))
if response.status_code == 200:
print(f"task_id: {response.json()['output']['task_id']}")
else:
print("task failed!")
print(response.json())
|
model string (必須) モデルの名前です。このパラメーターは、Qwen3-ASR-Flash-Filetrans モデルにのみ適用されます。 |
input object (必須) プロパティ file_url string (必須) 認識対象の音声ファイルの URL です。URL はパブリックネットワークからアクセス可能である必要があります。 RESTful API を使用する場合、音声ファイルが OSS に保存されている場合、oss:// で始まる一時的な URL はサポートされています。ただし、次の点にご注意ください:
重要 一時的な URL は 48 時間有効で、有効期限が切れると使用できなくなります。本番環境では使用しないでください。 アップロード認証情報を取得するための API は 100 QPS に制限されており、スケールアウトをサポートしていません。本番環境、高並行シナリオ、またはストレステストシナリオでは使用しないでください。 本番環境では、ファイルの長期的な可用性を確保し、レート制限の問題を回避するために、Alibaba Cloud OSS などの安定したストレージサービスを使用してください。
|
parameters object (オプション) プロパティ language string (オプション) デフォルト値なし 音声の言語がわかっている場合は、このパラメーターで指定すると認識精度が向上します。 指定できる言語は 1 つだけです。 音声の言語が不明な場合や、中国語、英語、日本語、韓国語が混在しているなど複数の言語が含まれる場合は、このパラメーターを指定しないでください。 有効な値: zh:中国語 (標準語、四川語、閩南語、呉語) yue:広東語 en:英語 ja:日本語 de:ドイツ語 ko:韓国語 ru:ロシア語 fr:フランス語 pt:ポルトガル語 ar:アラビア語 it:イタリア語 es:スペイン語 hi:ヒンディー語 id:インドネシア語 th:タイ語 tr:トルコ語 uk:ウクライナ語 vi:ベトナム語 cs:チェコ語 da:デンマーク語 fil:フィリピン語 fi:フィンランド語 is:アイスランド語 ms:マレー語 no:ノルウェー語 pl:ポーランド語 sv:スウェーデン語
enable_itn boolean (オプション) デフォルト:false テキスト逆正規化 (ITN) を有効にするかどうかを指定します。この機能は、中国語と英語の音声にのみ適用されます。 値: text string コンテキストを指定します。Qwen3-ASR-Flash では、背景テキストやエンティティ語彙などの参照情報を音声認識中にコンテキストとして提供し、カスタマイズされた結果を受け取ることができます。 長さ制限:10,000 トークン。 詳細については、「コンテキスト拡張」をご参照ください。 channel_id array (オプション) デフォルト:[0] マルチトラック音声ファイルで認識するオーディオトラックのインデックスを指定します。インデックスは 0 から始まります。たとえば、[0] は最初のトラックのみを認識することを示し、[0, 1] は最初のトラックと 2 番目のトラックの両方を認識することを示します。このパラメーターを指定しない場合、デフォルトで最初のトラックが処理されます。
重要 指定された各オーディオトラックは個別に課金されます。たとえば、1 つのファイルに対して [0, 1] をリクエストすると、2 つの個別の料金が発生します。 |