Request body | cURL# ======= Penting =======
# URL berikut untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/audio/asr/transcription
# Kunci API untuk wilayah Singapura dan Beijing berbeda. Untuk mendapatkan kunci API, lihat https://www.alibabacloud.com/help/en/model-studio/get-api-key.
# === Hapus komentar ini sebelum menjalankan ===
curl --location --request POST 'https://dashscope-intl.aliyuncs.com/api/v1/services/audio/asr/transcription' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header "Content-Type: application/json" \
--header "X-DashScope-Async: enable" \
--data '{
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id":[
0
],
"enable_itn": false
}
}'
Javaimport com.google.gson.Gson;
import com.google.gson.annotations.SerializedName;
import okhttp3.*;
import java.io.IOException;
public class Main {
// URL berikut untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/audio/asr/transcription
private static final String API_URL = "https://dashscope-intl.aliyuncs.com/api/v1/services/audio/asr/transcription";
public static void main(String[] args) {
// Kunci API untuk wilayah Singapura dan Beijing berbeda. Untuk mendapatkan kunci API, lihat https://www.alibabacloud.com/help/en/model-studio/get-api-key.
// Jika variabel lingkungan tidak diatur, ganti baris berikut dengan String apiKey = "sk-xxx" menggunakan Kunci API Model Studio Anda.
String apiKey = System.getenv("DASHSCOPE_API_KEY");
OkHttpClient client = new OkHttpClient();
Gson gson = new Gson();
/*String payloadJson = """
{
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id": [0],
"enable_itn": false,
"language": "zh",
"corpus": {
"text": ""
}
}
}
""";*/
String payloadJson = """
{
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id": [0],
"enable_itn": false
}
}
""";
RequestBody body = RequestBody.create(payloadJson, MediaType.get("application/json; charset=utf-8"));
Request request = new Request.Builder()
.url(API_URL)
.addHeader("Authorization", "Bearer " + apiKey)
.addHeader("Content-Type", "application/json")
.addHeader("X-DashScope-Async", "enable")
.post(body)
.build();
try (Response response = client.newCall(request).execute()) {
if (response.isSuccessful() && response.body() != null) {
String respBody = response.body().string();
// Parsing JSON dengan Gson
ApiResponse apiResp = gson.fromJson(respBody, ApiResponse.class);
if (apiResp.output != null) {
System.out.println("task_id: " + apiResp.output.taskId);
} else {
System.out.println(respBody);
}
} else {
System.out.println("tugas gagal! Kode HTTP: " + response.code());
if (response.body() != null) {
System.out.println(response.body().string());
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
static class ApiResponse {
@SerializedName("request_id")
String requestId;
Output output;
}
static class Output {
@SerializedName("task_id")
String taskId;
@SerializedName("task_status")
String taskStatus;
}
}
Pythonimport requests
import json
import os
# URL berikut untuk wilayah Singapura. Jika Anda menggunakan model di wilayah Beijing, ganti URL dengan: https://dashscope.aliyuncs.com/api/v1/services/audio/asr/transcription
url = "https://dashscope-intl.aliyuncs.com/api/v1/services/audio/asr/transcription"
# Kunci API untuk wilayah Singapura dan Beijing berbeda. Untuk mendapatkan kunci API, lihat https://www.alibabacloud.com/help/en/model-studio/get-api-key.
# Jika variabel lingkungan tidak diatur, ganti baris berikut dengan DASHSCOPE_API_KEY = "sk-xxx" menggunakan Kunci API Model Studio Anda.
DASHSCOPE_API_KEY = os.getenv("DASHSCOPE_API_KEY")
headers = {
"Authorization": f"Bearer {DASHSCOPE_API_KEY}",
"Content-Type": "application/json",
"X-DashScope-Async": "enable"
}
payload = {
"model": "qwen3-asr-flash-filetrans",
"input": {
"file_url": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
},
"parameters": {
"channel_id": [0],
# "language": "zh",
"enable_itn": False
# "corpus": {
# "text": ""
# }
}
}
response = requests.post(url, headers=headers, data=json.dumps(payload))
if response.status_code == 200:
print(f"task_id: {response.json()['output']['task_id']}")
else:
print("tugas gagal!")
print(response.json())
|
model string (Wajib) Nama model. Parameter ini hanya berlaku untuk model Qwen3-ASR-Flash-Filetrans. |
input object (Wajib) Properti file_url string (Wajib) URL file audio yang akan dikenali. URL harus dapat diakses dari jaringan publik. Saat menggunakan RESTful API, jika file audio disimpan di OSS, URL sementara yang dimulai dengan oss:// didukung. Namun, perhatikan hal berikut:
Penting URL sementara berlaku selama 48 jam dan tidak dapat digunakan setelah kedaluwarsa. Jangan menggunakannya di lingkungan produksi. API untuk mendapatkan unggah kredensial dibatasi hingga 100 QPS dan tidak mendukung penskalaan. Jangan menggunakannya di lingkungan produksi, skenario konkurensi tinggi, atau skenario uji stres. Untuk lingkungan produksi, gunakan layanan penyimpanan yang stabil seperti Alibaba Cloud OSS untuk memastikan ketersediaan file jangka panjang dan menghindari masalah pembatasan laju.
|
parameters object (Opsional) Properti language string (Opsional) Tidak ada nilai default Jika Anda mengetahui bahasa audio, Anda dapat menentukannya menggunakan parameter ini untuk meningkatkan akurasi pengenalan. Anda hanya dapat menentukan satu bahasa. Jika bahasa audio tidak pasti atau mencakup beberapa bahasa, seperti campuran bahasa Mandarin, Inggris, Jepang, dan Korea, jangan tentukan parameter ini. Nilai yang valid: enable_itn boolean (Opsional) Default: false Menentukan apakah akan mengaktifkan Inverse Text Normalization (ITN). Fitur ini hanya berlaku untuk audio berbahasa Mandarin dan Inggris. Nilai: true: aktifkan false: nonaktifkan
text string Menentukan konteks. Qwen3-ASR-Flash memungkinkan Anda memberikan informasi referensi, seperti teks latar belakang dan kosakata entitas, sebagai konteks selama pengenalan ucapan untuk mendapatkan hasil yang disesuaikan. Batas panjang: 10.000 token. Untuk informasi lebih lanjut, lihat Peningkatan konteks. channel_id array (Opsional) Default: [0] Menentukan indeks track audio dalam file audio multi-track yang akan dikenali. Indeks dimulai dari 0. Misalnya, [0] menunjukkan bahwa hanya track pertama yang dikenali, dan [0, 1] menunjukkan bahwa track pertama dan kedua dikenali. Jika Anda tidak menentukan parameter ini, track pertama diproses secara default.
Penting Setiap track audio yang ditentukan ditagih secara terpisah. Misalnya, permintaan untuk [0, 1] untuk satu file dikenai biaya dua kali terpisah. |