全部產品
Search
文件中心

:功能特性

更新時間:Jan 30, 2024

ApsaraVideo for Media Processing,將一個音視頻檔案轉換成另一個或多個音視頻檔案,以適應不同網路頻寬、不同終端裝置和不同的使用者需求。同時基于海量資料深度學習,對媒體的內容、文字、語音、情境多模態分析,實現智能審核、內容理解、智能編輯。

您可以使用ApsaraVideo for Media Processing解決哪些問題?

  • 適配終端裝置:轉換媒體格式,支援PC、TV以及移動終端等多平台播放;

  • 適配網路環境:把視頻轉碼為標清、高清、超高清等多個清晰度,以便不同網路頻寬的使用者選擇最佳碼率,流暢播放;

  • 添加浮水印:在視頻中添加浮水印(例如,企業logo、電視台台標、使用者暱稱),突出品牌和著作權,增加產品識別度;

  • 截圖:截取指定時間點的畫面,用做視頻封面或產生雪碧圖;

  • 視頻編輯:對視頻進行剪輯、拼接等二次創作;

  • 畫質修複:針對畫質較差的視頻,去除畫面中的毛刺、馬賽克等,修複為高清晰版本;

  • 降低儲存、分發成本: 保證在相同畫質品質的前提下,調整視頻碼率、提高視頻壓縮率、減小檔案體積,從而減少播放卡頓並節省儲存和流量費用;

  • 視頻去重、原創識別:提取視頻中的映像、音頻等指紋特徵,產生視頻指紋,實現重複視頻尋找、視頻片段查源等功能,適用於視頻去重、侵權視頻過濾、原創識別、視頻溯源等情境;

  • 智能審核:智能識別視頻內語音、文字、畫面的色情、暴恐涉政、廣告、不良畫面等內容,大幅節省人工審核人力成本,降低違規風險;

  • 提升轉化:通過對視頻內容理解,結合畫面美學和海量使用者行為資料,選出最優主要畫面格,產生圖片、動圖或短視頻,可用做視頻封面,提升視頻點擊轉化。

轉碼

封裝格式

參數

說明

輸入格式

  • 容器格式:3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM、MXF

  • 視頻編碼格式:H.264/AVC、H.263、 H.263+、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、Quicktime、RealVideo、Windows Media Video

  • 音頻編碼格式:AAC、AC-3、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、Windows Media Audio

輸出格式

  • 容器格式:

    • 視頻:FLV、MP4、HLS(m3u8+ts)、MPEG-DASH(MPD+fMP4)

    • 音頻:MP3、MP4、OGG、FLAC、m4a

    • 圖片:GIF、WEBP

  • 視頻編碼格式:H.264/AVC、 H.265/HEVC

  • 音頻編碼格式:MP3、AAC、VORBIS、FLAC

音頻提取

從視頻檔案中單獨分離出音頻,即禁用視頻

視頻提取

從視頻檔案中單獨分離出視頻,即禁用音頻

轉封裝

不改變視頻的編碼方式,僅改變封裝格式。支援音視頻轉封裝為MP4、M3U8、FLV三種格式

視頻轉動圖

對視頻的精彩片段截取動圖(GIF/WEBP格式)用於展示

視頻編碼參數

參數

說明

Codec

編解碼格式。

  • 支援H.264、H.265、GIF、WEBP。

  • 預設值:H.264。

Bitrate

碼率。

  • 支援輸出碼率範圍:[10,50000]。

  • 單位:Kbps。

Fps

幀率。

  • 預設值取輸入檔案幀率,當輸入檔案幀率超過60時,取60。

  • 取值範圍:(0,60]。

  • 單位:fps。

Width* Height

解析度。

  • 寬:

    • 預設值:視頻原始寬度。

    • 取值範圍:[128,4096]。

    • 單位:px。

  • 高:

    • 預設值:視頻原始高度。

    • 取值範圍:[128,4096]。

    • 單位:px。

Scale

自動縮放。支援按照寬度等比例縮放支援按照高度等比例縮放。

Gop

主要畫面格間最大時間間隔或者最大幀數。

  • 最大時間間隔時,必傳單位,單位:s。預設值:10s。

  • 最大幀數時,無單位。取值範圍:[1,100000]

Profile

編碼層級。H.264:支援Baseline、Main、High三種編碼層級。

PixFmt

視頻顏色格式。

  • 支援yuv420p、yuvj420p等標準顏色格式。

  • 預設值:yuv420p或原始顏色格式。

Rotate

視頻旋轉角度 。把視頻畫面順時針旋轉。

  • 取值範圍:[0,360)。

  • 預設值:0。

視頻處理參數

參數

說明

ScanMode

掃描模式。支援interlaced、progressive。

Rate Control Modes

碼率控制方法。支援如下幾種碼率控制方法:VBR、CBR、CRF。

Crop

視頻畫面裁切。支援自動檢測黑邊並裁切,支援自訂裁切參數。

Pad

視頻貼黑邊。支援。

音頻編碼參數

參數

說明

Codec

編解碼格式。

  • 音頻編解碼格式,AAC、MP3、VORBIS、FLAC。

  • 預設值:AAC。

Samplerate

採樣率。

  • 預設值:44100。

  • 支援22050、32000、44100、48000、96000。

  • 單位:Hz。

  • 若視頻容器格式為FLV,音頻編解碼格式選擇為MP3時,採樣率不支援32000、48000、96000。

  • 若音頻編解碼格式為MP3時,採樣率不支援96000。

Bitrate

音頻碼率。

  • 預設值:128。

  • 碼率範圍:[8,1000]。

  • 單位:Kbps。

Channels

聲道數。

  • 預設值:2。

  • 當Codec設定為 MP3 時,聲道數只支援1、2。

  • 當Codec設定為 AAC 時,聲道數只支援1、2、4、5、6、8。

轉碼控制

類別

說明

HLS MasterPlayList

將多字幕、多音軌、多碼率視頻流產生一個Master Playlist檔案

條件轉碼

支援兩種方式:

  • 如果轉碼模板的碼率(或解析度)比輸入視頻更高,則不進行該規格的視頻轉碼。

  • 如果轉碼模板的碼率(或解析度)比輸入視頻更高,則在進行該規格的轉碼時,輸出碼率(或解析度)等於輸入視頻碼率(或解析度)。

工作流程

雲端自動化處理工作流程,音視頻上傳完畢後自動執行處理流程。

轉碼模板

預置模板

ApsaraVideo for Media Processing服務為適配一定網路頻寬範圍的輸出視頻預設了一系列轉碼模版:

  • 預置智能模版

    會根據輸入視頻的具體情況而自動調整轉碼參數以滿足輸出視頻要求。由於輸入視頻本身有差異(解析度、碼率等),不一定所有的預置智能模板都適合。因此,需要通過模版分析作業來擷取指定輸入檔案的可用預置模版。多媒體檔案的轉碼,實際是在儘可能壓縮檔大小(即降低碼率)與儘可能減少檔案品質損失之間的平衡,預置智能模版以品質優先。

  • 預置靜態模版

    可以直接調用的預置模版,無需進行模版分析。它分為三類:視頻轉碼模版、音頻MP3轉碼模版及轉封裝模版,涵蓋常見的播放裝置及頻寬條件,以碼率控制優先。

  • 預置窄帶高清TM模版

    可以直接調用的預置模版,無需進行模版分析。提供FLV、MP4、M3U8三種輸出格式的視頻轉碼模版。預置窄帶高清TM模版是阿里雲ApsaraVideo for Media Processing獨設的一組轉碼模板,相比普通轉碼模板,在相同的清晰度下,能帶來更低的碼率,協助您節約更多的成本。

自訂模板

由使用者自行定義轉碼參數的轉碼模版,它是轉碼參數(音頻、視頻、容器等)的集合,可以滿足使用者個人化的轉碼需求。

編輯

類別

說明

視訊剪輯

支援指定時間點開始,截取指定時間長度的媒體剪輯。

視頻拼接

最多支援20個視頻拼接。

模糊處理

支援對視頻指定地區進行模糊處理。

開場和關板

  • 在視頻開頭,疊加動態logo,並指定片尾內容。

  • 增加產品識別度,突出著作權。

浮水印

類別

說明

靜態浮水印

  • 支援在輸出的視頻上覆蓋最多20個浮水印。

  • 支援PNG、文字、MOV、APNG格式。

動態浮水印

支援指定浮水印的顯示時間。

截圖

類別

說明

視頻截圖

  • 對儲存於OSS上的視頻檔案截取指定時間的JPG格式映像。

  • 支援單張截圖、多張截圖、平均截圖。

雪碧圖/webvtt縮圖

截取一系列圖片產生雪碧圖,通過一次請求擷取多張圖片的資訊,大幅降低圖片請求數量,提高用戶端效能。

智能首圖

通過對視頻內容的理解並結合畫面美學,選出最優的主要畫面格作為視頻封面圖。

窄帶高清TM

類別

說明

窄帶高清TM1.0

基於阿里雲轉碼技術,對視頻中每個情境、動作、內容、紋理等進行智能分析,保證相同視頻畫質下,碼率更低,在一定程度上降低頻寬成本。

窄帶高清TM2.0

  • 從人眼視覺模型出發,將編碼器的最佳化目標從經典的“逼真度最高”調整為“主觀體驗最好”。

  • 憑藉專屬的演算法,突破當代視頻編碼器的能力上限,在節省碼率的同時,也能提供更加清晰的觀看體驗。

畫質重生

類別

說明

高幀率視頻重製 (FRC)

對於30幀/秒以內的普通幀率高清節目,產生60幀/秒甚至120幀/秒的高幀率版本,4K大屏播放也無頓挫感。

片源修複 (PicRescue)

對於被過度壓縮的網路視頻,去除畫面中的毛刺和馬賽克,產生更高清晰度的修複重製版。

標清轉高清重製服務(SD轉HD)

對於標清的經典老片,去除膠捲粒紋和壓縮雜訊,加以超解析度技術,產生720p甚至1080p的高清版本。

2K轉4K重製服務(2K轉4K)

對於1080p影片,利用基于海量視頻訓練的超解析度技術,產生獨家高品質4K節目源。

倍速轉碼

適用於30分鐘以上的長視頻,通過對視頻分區並行轉碼,大幅提升轉碼速度,轉碼速度可提升5倍。

更多功能

類別

說明

媒體資訊

支援擷取儲存於OSS上的音、視頻檔案的編碼和內容資訊。

M3U8輸出自訂切片時間長度

  • 支援自訂設定M3U8切片時間長度,範圍從1秒至60秒。

  • 有助於使用者根據播放端頻寬條件來設定切片時間長度,降低使用者首屏載入時間。

外掛字幕

轉碼支援匯入外部字幕檔案並指定字幕編碼格式。

訊息通知整合

  • 整合MNS服務。

  • 為管道設定訊息通知屬性,管道內轉碼作業非同步介面的返回訊息可通過訊息通知服務主動推送到使用者的訊息接收服務。

播放

  • 提供Web播放器,支援Flash、HTML5及自適應模式。

  • 提供移動端播放器SDK,支援iOS、Android。