All Products
Search
Document Center

Intelligent Media Services:SubmitAudioProduceJob

Last Updated:Apr 07, 2026

API ini mengonversi teks menjadi file audio speech berkualitas tinggi.

Deskripsi operasi

Ini adalah API asinkron. Setelah Anda mengirimkan pekerjaan, Anda akan menerima ID pekerjaan, dan pekerjaan tersebut diproses di latar belakang. Anda dapat memperoleh hasilnya melalui notifikasi callback atau dengan menanyakan status pekerjaan menggunakan API GetSmartJobResult.

Coba sekarang

Coba API ini di OpenAPI Explorer tanpa perlu penandatanganan manual. Panggilan yang berhasil akan secara otomatis menghasilkan contoh kode SDK sesuai dengan parameter Anda. Unduh kode tersebut dengan kredensial bawaan yang aman untuk penggunaan lokal.

Test

RAM authorization

Tabel berikut menjelaskan otorisasi yang diperlukan untuk memanggil API ini. Anda dapat menentukannya dalam kebijakan Resource Access Management (RAM). Kolom pada tabel dijelaskan sebagai berikut:

  • Action: Aksi yang dapat digunakan dalam elemen Action pada pernyataan kebijakan izin RAM untuk memberikan izin guna melakukan operasi tersebut.

  • API: API yang dapat Anda panggil untuk melakukan aksi tersebut.

  • Access level: Tingkat akses yang telah ditentukan untuk setiap API. Nilai yang valid: create, list, get, update, dan delete.

  • Resource type: Jenis resource yang mendukung otorisasi untuk melakukan aksi tersebut. Ini menunjukkan apakah aksi tersebut mendukung izin tingkat resource. Resource yang ditentukan harus kompatibel dengan aksi tersebut. Jika tidak, kebijakan tersebut tidak akan berlaku.

    • Untuk API dengan izin tingkat resource, jenis resource yang diperlukan ditandai dengan tanda bintang (*). Tentukan Nama Sumber Daya Alibaba Cloud (ARN) yang sesuai dalam elemen Resource pada kebijakan.

    • Untuk API tanpa izin tingkat resource, ditampilkan sebagai All Resources. Gunakan tanda bintang (*) dalam elemen Resource pada kebijakan.

  • Condition key: Kunci kondisi yang didefinisikan oleh layanan. Kunci ini memungkinkan kontrol granular, berlaku baik hanya untuk aksi maupun untuk aksi yang terkait dengan resource tertentu. Selain kunci kondisi spesifik layanan, Alibaba Cloud menyediakan serangkaian common condition keys yang berlaku di semua layanan yang didukung RAM.

  • Dependent action: Aksi dependen yang diperlukan untuk menjalankan aksi tersebut. Untuk menyelesaikan aksi tersebut, pengguna RAM atau role RAM harus memiliki izin untuk melakukan semua aksi dependen.

Action

Access level

Resource type

Condition key

Dependent action

ice:SubmitAudioProduceJob

*全部资源

*

None None

Parameter permintaan

Parameter

Type

Required

Description

Example

EditingConfig

string

Yes

Konfigurasi produksi audio:

  • voice: Jenis voice.

  • customizedVoice: ID voice kustom untuk voice cloning.

  • format: Format file output. Format yang didukung: PCM, WAV, dan MP3.

  • volume: Volume. Nilainya berkisar antara 0 hingga 100. Default: 50.

  • speech_rate: Laju ucapan. Nilainya berkisar antara -500 hingga 500. Default: 0.
    • Nilai -500, 0, dan 500 masing-masing setara dengan kecepatan 0,5x, 1,0x, dan 2,0x.

    • Metode perhitungan:
      • Untuk pengali kecepatan 0,8x: (1 - 1/0,8) / 0,002 = -125.

      • Untuk pengali kecepatan 1,2x: (1 - 1/1,2) / 0,001 = 166.

      • Untuk pengali kecepatan kurang dari 1, gunakan faktor 0,002.

      • Untuk pengali kecepatan lebih dari 1, gunakan faktor 0,001.

  • pitch_rate: Laju pitch. Nilainya berkisar antara -500 hingga 500. Default: 0.
    Penting Jika Anda memberikan voice dan customizedVoice sekaligus, customizedVoice akan diutamakan.

{"voice":"Siqi","format":"MP3","volume":50}

OutputConfig

string

Yes

Konfigurasi output audio.

例如将输出的语音存至:http://my_bucket.oss-cn-shanghai.aliyuncs.com/target_audio.mp3,则此参数配置为: { "bucket": "my_bucket", "object": "target_audio" }

InputConfig

string

Yes

Teks yang akan disintesis. Panjang maksimum adalah 10.000 karakter. Mendukung SSML.

测试文本

Title

string

No

Judul pekerjaan. Jika Anda tidak memberikan judul, sistem akan secara otomatis menghasilkan satu berdasarkan tanggal saat ini.

  • Tidak boleh melebihi 128 byte.

  • Harus dikodekan dalam UTF-8.

任务标题。 若不提供,根据日期自动生成默认title 长度不超过128字节 UTF8编码

Description

string

No

Deskripsi pekerjaan.

  • Tidak boleh melebihi 1.024 byte.

  • Harus dikodekan dalam UTF-8.

任务描述长度不超过1024字节 UTF8编码

UserData

string

No

Pengaturan kustom dalam format JSON. Panjang maksimum adalah 512 byte. Parameter ini mendukung konfigurasi alamat callback kustom.

{"NotifyAddress":"http://xx.xx.xxx"}或{"NotifyAddress":"https://xx.xx.xxx"}或{"NotifyAddress":"ice-callback-demo"}

Overwrite

boolean

No

Menentukan apakah file OSS yang sudah ada akan ditimpa.

true

Elemen respons

Element

Type

Description

Example

object

Badan respons.

RequestId

string

ID permintaan.

******11-DB8D-4A9A-875B-275798******

JobId

string

ID pekerjaan.

****20b48fb04483915d4f2cd8ac****

State

string

Status pekerjaan.

  • Created

  • Executing

  • Finished

  • Failed

Created

MediaId

string

ID media.

****2bcbfcfa30fccb36f72dca22****

Gunakan ID pekerjaan bersama API GetSmartJobResult untuk menanyakan informasi detail tentang pekerjaan text-to-speech. Contoh berikut menunjukkan respons contoh dari API GetSmartJobResult untuk pekerjaan yang berhasil.

Catatan

Secara default, mesin TTS melakukan segmentasi teks berdasarkan tanda baca seperti koma dan titik.

{
  "RequestId": "******2D-443C-5043-B0E4-867070******",
  "JobId": "******042d5e4db6866f6289d1******",
  "State": "Finished",
  "SmartJobInfo": {
    "Title": "default_title_2022-01-21T06:15:07Z",
    "JobType": "TextToSpeech",
    "CreateTime": "2022-01-21T06:15:07Z",
    "ModifiedTime": "2022-01-21T06:15:07Z",
    "InputConfig": {
      "InputFile": "Speaking of Guo Degang, he is extremely popular now. Tickets are often expensive but sell out instantly. He also participates in various crosstalk variety shows to comment on new performers."
    },
    "EditingConfig": "{\"format\":\"MP3\",\"pitch_rate\":0,\"sample_rate\":16000,\"speech_rate\":0,\"voice\":\"Siqi\",\"volume\":50}",
    "OutputConfig": {
      "Bucket": "your-bucket",
      "Object": "your-audio"
    }
  },
  "JobResult": {
    "MediaId": "******bf47c94e82b3b2014361******",
    "AiResult": "[{\"text\":\"Speaking of Guo Degang,\",\"begin_time\":0,\"end_time\":846},{\"text\":\"he is extremely popular now.\",\"begin_time\":846,\"end_time\":3386},{\"text\":\"Tickets are often expensive\",\"begin_time\":3386,\"end_time\":4402},{\"text\":\"but sell out instantly.\",\"begin_time\":4402,\"end_time\":6265},{\"text\":\"He also participates in various crosstalk variety shows to comment on new performers.\",\"begin_time\":6265,\"end_time\":10330}]"
  }
}

Contoh

Respons sukses

JSONformat

{
  "RequestId": "******11-DB8D-4A9A-875B-275798******",
  "JobId": "****20b48fb04483915d4f2cd8ac****",
  "State": "Created",
  "MediaId": "****2bcbfcfa30fccb36f72dca22****"
}

Kode kesalahan

Lihat Error Codes untuk daftar lengkap.

Catatan rilis

Lihat Release Notes untuk daftar lengkap.