全部產品
Search
文件中心

Intelligent Media Services:SubmitAudioProduceJob - 提交智能語音任務

更新時間:Mar 21, 2026

本介面用於將提供的常值內容轉換成高品質的語音音頻檔案。

調試

您可以在OpenAPI Explorer中直接運行該介面,免去您計算簽名的困擾。運行成功後,OpenAPI Explorer可以自動產生SDK程式碼範例。

調試

授權資訊

下表是API對應的授權資訊,可以在RAM權限原則語句的Action元素中使用,用來給RAM使用者或RAM角色授予調用此API的許可權。具體說明如下:

  • 操作:是指具體的許可權點。

  • 存取層級:是指每個操作的存取層級,取值為寫入(Write)、讀取(Read)或列出(List)。

  • 資源類型:是指操作中支援授權的資源類型。具體說明如下:

    • 對於必選的資源類型,用前面加 * 表示。

    • 對於不支援資源級授權的操作,用全部資源表示。

  • 條件關鍵字:是指雲產品自身定義的條件關鍵字。

  • 關聯操作:是指成功執行操作所需要的其他許可權。操作者必須同時具備關聯操作的許可權,操作才能成功。

操作

存取層級

資源類型

條件關鍵字

關聯操作

ice:SubmitAudioProduceJob

*全部資源

*

請求參數

名稱

類型

必填

描述

樣本值

EditingConfig

string

音頻生產配置:

  • voice 聲音類型

  • customizedVoice 人聲複製的 VoiceId

  • format 輸出檔案格式,支援:PCM/WAV/MP3

  • volume 音量,取值 0~100,預設值 50

  • speech_rate 語速,取值範圍:-500~500,預設值:0
    • [-500, 0, 500] 對應的語速倍速區間為 [0.5, 1.0, 2.0]

    • 計算方法如下:
      • 0.8 倍速(1-1/0.8)/0.002 = -125

      • 1.2 倍速(1-1/1.2)/0.001 = 166

      • 小於 1 倍速時,使用 0.002 係數

      • 大於 1 倍速時,使用 0.001 係數

  • pitch_rate 語調,取值範圍:-500~500,預設值:0
    重要 如果同時傳入 voice 和 customizedVoice 會優先使用 customizedVoice。

{"voice":"Siqi","format":"MP3","volume":50}

OutputConfig

string

音訊輸出配置

例如將輸出的語音存至:http://my_bucket.oss-cn-shanghai.aliyuncs.com/target_audio.mp3,則此參數配置為: { "bucket": "my_bucket", "object": "target_audio" }

InputConfig

string

常值內容,最大支援 10000 個漢字。支援 SSML 標記語言

測試文本

Title

string

任務標題。若不提供,根據日期自動產生預設 title

  • 長度不超過 128 位元組

  • UTF8 編碼

任務標題。 若不提供,根據日期自動產生預設title 長度不超過128位元組 UTF8編碼

Description

string

任務描述:

  • 長度不超過 1024 位元組

  • UTF8 編碼

任務描述長度不超過1024位元組 UTF8編碼

UserData

string

自訂設定,Json 格式,長度限制為 512 位元組。支援自訂回調地址配置

{"NotifyAddress":"http://xx.xx.xxx"}或{"NotifyAddress":"https://xx.xx.xxx"}或{"NotifyAddress":"ice-callback-demo"}

Overwrite

boolean

是否覆蓋現有 OSS 檔案。

true

返回參數

名稱

類型

描述

樣本值

object

Schema of Response

RequestId

string

請求 ID

******11-DB8D-4A9A-875B-275798******

JobId

string

任務 ID

****20b48fb04483915d4f2cd8ac****

State

string

任務狀態:

  • Created

  • Executing

  • Finished

  • Failed

Created

MediaId

string

媒資 Id

****2bcbfcfa30fccb36f72dca22****

智能語音任務執行結果可以用智能語音任務 JobId 通過擷取智慧工作提示結果介面查詢任務執行詳細資料,任務執行成功時擷取智慧工作提示結果介面返回結果樣本如下。

說明

AI_TTS 預設根據中文逗號、句號等標點符號進行斷句

{
  "RequestId": "******2D-443C-5043-B0E4-867070******",
  "JobId": "******042d5e4db6866f6289d1******",
  "State": "Finished",
  "SmartJobInfo": {
    "Title": "default_title_2022-01-21T06:15:07Z",
    "JobType": "TextToSpeech",
    "CreateTime": "2022-01-21T06:15:07Z",
    "ModifiedTime": "2022-01-21T06:15:07Z",
    "InputConfig": {
      "InputFile": "提起郭德綱,現在可以說是紅的發紫了,常常票價很高,但是一開手就被瘋搶一空,還參加各種相聲綜藝節目點評新人表演演員已經"
    },
    "EditingConfig": "{\"format\":\"MP3\",\"pitch_rate\":0,\"sample_rate\":16000,\"speech_rate\":0,\"voice\":\"Siqi\",\"volume\":50}",
    "OutputConfig": {
      "Bucket": "your-bucket",
      "Object": "your-audio"
    }
  },
  "JobResult": {
    "MediaId": "******bf47c94e82b3b2014361******",
    "AiResult": "[{\"text\":\"提起\",\"begin_time\":0,\"end_time\":846},{\"text\":\"現在可以說是紅的發紫了\",\"begin_time\":846,\"end_time\":3386},{\"text\":\"常常票價很高\",\"begin_time\":3386,\"end_time\":4402},{\"text\":\"但是一開手就被瘋搶一空\",\"begin_time\":4402,\"end_time\":6265},{\"text\":\"還參加各種相聲綜藝節目點評新人表演演員已經\",\"begin_time\":6265,\"end_time\":10330}]"
  }
}

樣本

正常返回樣本

JSON格式

{
  "RequestId": "******11-DB8D-4A9A-875B-275798******",
  "JobId": "****20b48fb04483915d4f2cd8ac****",
  "State": "Created",
  "MediaId": "****2bcbfcfa30fccb36f72dca22****"
}

錯誤碼

訪問錯誤中心查看更多錯誤碼。

變更歷史

更多資訊,參考變更詳情