全部產品
Search
文件中心

Intelligent Media Services:視頻翻譯

更新時間:Nov 07, 2025

視頻翻譯技術利用人工智慧和機器學習演算法,能夠高效、準確地將視頻內容從源語言轉換為一種或多種目標語言。這項技術不僅涵蓋字幕翻譯,還包括語音(口播)翻譯和面容(口型)同步翻譯,確保翻譯後的內容在視覺和聽覺上的一致性與自然性。同時,它能夠跨越語言障礙,豐富教育內容,提升娛樂體驗,從而極大地促進跨文化交流。

說明

目前已開通的地區為:

  • 字幕級翻譯:華東2(上海)、華北2(北京)、華南1(深圳)、華東1(杭州)、亞太地區東南 1(新加坡)、美洲(美國-西部)

  • 語音級翻譯:華東2(上海)、華北2(北京)、華南1(深圳)、華東1(杭州)、亞太地區東南 1(新加坡)、美洲(美國-西部)

  • 面容級翻譯:華東 2(上海)、亞太地區東南 1(新加坡),其他地區暫不支援。

功能優勢

多語言與方言支援:

  • 支援超過40種國家語言的翻譯服務。

  • 提供中國10多種方言的支援,滿足多樣化的語音需求。

  • 一次翻譯任務支援輸出超過40種不同的目標語言。

廣泛的視頻格式相容性:

  • 支援多種主流視頻格式,包括MP4、WebM、MOV、M3U8等,確保您的內容無縫整合。

豐富的音頻格式與自訂選項:

  • 支援MP3、WAV等多種音頻格式。

  • 允許使用者進行個人化配置,以滿足不同情境下的具體需求。

功能特性

智能媒體服務所提供的視頻翻譯服務,支援字幕級翻譯語音(口播)級翻譯面容(口型)級翻譯。其主要功能特性包括:

功能

功能描述

特性亮點

字幕級翻譯

  • 提取現有視頻字幕

  • 擦除原字幕

  • 多語種字幕翻譯

  • 一次翻譯任務支援輸出多目標語種視頻

  • 新字幕回填

高效、準確的文字翻譯,適用於需要快速添加多語言支援的情境。

語音(口播)級翻譯

字幕級翻譯的基礎上還支援:

  • 音色複刻

  • 使用原說話人的音色進行字幕播報

  • 一次翻譯任務支援輸出多目標語種視頻

  • 完成音頻回填

在文字翻譯的基礎上增加了聲音維度,保持了原聲的真實性和情感傳遞,提升觀眾體驗。

面容(口型)級翻譯

前兩種翻譯能力的基礎上,還支援說話人口型對齊。

最進階別的翻譯服務,確保視覺和聽覺的一致性,特別適合於高度真實的互動或宣傳內容。

語音翻譯修正/二次剪輯

  • 可通過雲剪輯(可視化操作)和OpenAPI對翻譯結果進行語音、字幕翻譯的二次修正。

  • 支援翻譯後視頻的再創作。

靈活調整翻譯輸出,滿足個人化需求,允許使用者根據具體情況進行微調,以達到最佳效果。

計費說明

計費說明詳見視頻翻譯計費

使用說明

為了讓使用者能夠輕鬆建立和管理視頻翻譯任務,我們提供了控制台、雲剪輯和OpenAPI三種途徑。

  • 智能媒體服務控制台:適合希望通過圖形介面直觀操作的使用者。

  • 雲剪輯:對於熟悉視頻編輯且希望靈活調整翻譯輸出的使用者來說,雲剪輯提供了更為精細的操作空間。使用者可以在剪輯工程中直接添加素材,使用AI翻譯工具進行翻譯,並對結果進行二次修正。

  • OpenAPI:面向開發人員和技術人員,通過編程介面調用視頻翻譯服務,允許整合到第三方系統中自動化處理大批量視頻翻譯工作。

不同翻譯層級支援的方式如下:

建立翻譯任務

方法一:通過控制台建立翻譯任務

  1. 訪問智能媒體服務-視頻翻譯, 進入翻譯工作清單頁。

  2. 在頂部左上方根據實際情況選擇地區。

  3. 單擊建立翻譯任務按鈕進入到建立翻譯任務頁面。image

  4. 根據頁面提示,完成參數設定:

    • 翻譯方式:選擇字幕級翻譯、語音級翻譯、面容級翻譯。

    • 選擇源檔案:上傳需要翻譯的視頻檔案。目前支援mp4、webm、mov格式的視頻。

    • 字幕來源:包括是否擦除原字幕、字幕來源等選項。其中,字幕來源包括OCR識別、ASR識別指定srt源字幕檔案三種方式。

      • OCR識別:當您沒有現成的字幕檔案但擁有帶有可見文字的視頻時,可以通過OCR識別技術從視頻畫面中提取字幕文本。為了提高效率和準確性,使用者還可以指定OCR識別範圍

      • ASR識別:如果您的視頻檔案沒有字幕,可以通過ASR識別從音軌中識別語音提取字幕。

      • OCR/ASR識別:結合OCR和ASR的一種提取字幕的方式,優先使用OCR識別字幕,如果OCR識別失敗,則通過ASR識別擷取到字幕。

      • 指定srt源字幕檔案:如果已經有現成的字幕檔案(如.srt格式),可以直接將其載入到視頻編輯軟體中與視頻同步播放。

    • 翻譯語言:支援一次性選擇多個目標語言,提交翻譯任務後,系統將為您產生多個目標語言的視頻檔案。

    • 儲存目錄與檔案名稱:指定翻譯後檔案的儲存位置和名稱。

  5. 確認所有參數無誤後,單擊提交翻譯任務以完成任務建立。

  6. 您可以通過工作清單查詢任務狀態、參數及翻譯結果。當任務狀態變更為處理完成時,單擊查看詳情瞭解任務詳細資料。

    image

方法二:通過雲剪輯建立翻譯任務

準備工作

如果您對雲剪輯尚不熟悉,建議您首先學習並瞭解雲剪輯相關的操作指南。

操作流程

  1. 訪問智能媒體服務-雲剪輯

  2. 在頂部左上方根據實際情況選擇地區。

  3. 視訊剪輯工程頁簽下,單擊建立剪輯工程,按照頁面提示完成剪輯工程建立後,單擊列表中的剪輯按鈕進入到雲剪輯的創作頁面。image

  4. 在左上方資產庫中,單擊匯入素材從螢幕右側添加素材的彈窗中,選擇所需要翻譯的檔案,添加到資產庫中,然後單擊檔案右下角的image表徵圖或者直接拖動檔案添加到下方的剪輯操作區的軌道。

  5. 請在下方剪輯軌道中選擇需要進行翻譯的音頻或視頻,點擊右上方屬性編輯區的AI翻譯按鈕以開啟視頻翻譯操控面板。根據頁面提示,依次完成翻譯類型、字幕提取、翻譯語言及字幕擦除等設定,最後點擊發起任務以提交翻譯任務。此處以語音層級翻譯為例,如下圖所示。

  6. 請稍候幾分鐘,您將能夠在剪輯軌道上查看翻譯結果,詳見下圖所示。image

  7. 完成任務後,您可以單擊右上方的匯出為 > 匯出視頻,系統將彈出合成視頻的視窗。請根據頁面提示進行相應填寫後,單擊確定,即可將翻譯完成的視頻進行合成與匯出。screen_recording_2024-12-20_00-23-26

方法三:通過OpenAPI建立視頻翻譯

  1. 建立翻譯任務

    根據您的業務需求設定相應的介面參數,並調用SubmitVideoTranslationJob - 提交視頻翻譯任務。在提交時,請確保您已經仔細閱讀了視頻翻譯參數介紹與樣本,以正確配置各項參數。

  2. 查詢單個翻譯任務結果

    要擷取特定視頻翻譯任務的狀態和結果,可以調用GetSmartHandleJob - 擷取視頻翻譯任務結果。此介面允許您檢索指定任務的詳細資料,包括處理進度、完成時間以及最終的翻譯輸出連結。

  3. 查詢翻譯工作清單

    如果您需要查看所有進行中或已完成的視頻翻譯任務,可以使用ListSmartJobs - 擷取視頻翻譯工作清單來列出這些任務。

  4. 刪除翻譯任務

    對於已完成並且不再需要儲存的任務,可以通過調用DeleteSmartJob - 刪除智慧工作提示將其從系統中移除,釋放資源。

語音翻譯-二次修正(可選)

重要
  • 如果對語音層級的翻譯結果不滿意,並希望對結果進行二次修正,請在提交翻譯任務之前啟用“是否開啟二次編輯”參數。接下來將介紹兩種針對語音級翻譯結果進行二次修正的方法。

  • 注意:目前的版本的“面容級翻譯”僅支援對語音進行二次翻譯修正,暫不支援對視頻中人物的面容口型進行二次修正。

方法一:通過OpenAPI實現

通過調用OpenAPI實現語音級翻譯結果的修正。詳見語音翻譯 - 人工修正

方法二:通過雲剪輯(webSDK)實現

準備工作

如果您對雲剪輯尚不熟悉,建議您首先學習並瞭解雲剪輯相關的操作指南。

操作流程

  1. 訪問智能媒體服務-視頻翻譯, 進入翻譯工作清單頁,選擇需要進行二次修正的任務。

  2. 並在操作列中單擊翻譯修正/剪輯按鈕,以開啟相應的雲剪輯工程。後續操作詳見下方視頻講解:

常見問題

結合音訊波形圖設定單行字幕的起止時間

例如,您希望將翻譯後的字幕“Great where are you”拆分為兩段,分別為“Great”和“where are you”,如下圖所示。您可以通過調整字幕的起止時間,盡量將字幕的起止時間點音訊波形的波穀處相對應。經過這樣的處理,語音翻譯的二次修正效果將會更加最佳化。

image

控制二次修正的字幕字數

在進行二次翻譯修正時,如需對翻譯後的雙語字幕內容進行編輯,務必確保調整後的字幕字數不超過調整前字數的1.5倍,否則可能導致二次翻譯修正後的語音語速過快。

例如:第一次翻譯後的某一行譯文為:Let's talk about this later. We need to go home now

錯誤樣本:Let's discuss this matter in more detail at a later time. Right now, we should focus on heading back home as it's important to ensure we get there safely and in good time. We can revisit this conversation when we are both more relaxed and have ample opportunity to explore all the aspects thoroughly.

正確樣本:Let's pick this up another time. We should be going home now.

相關文檔

如果您想通過OpenAPI提交翻譯任務,可提前瞭解視頻翻譯參數介紹與樣本