全部產品
Search
文件中心

:Timeline配置說明

更新時間:Jul 15, 2025

時間軸是將素材按照視頻創意進行編排和特效設計的產物。時間軸主要包含軌道、素材、效果3種對象。更多時間軸樣本請參考最佳實務

名稱

類型

是否必填

描述

VideoTracks

VideoTrack[]

否,視頻軌為空白時,音頻軌必須非空。

視頻軌列表。多個軌道的層疊順序與數組元素順序一致,如:數組的第一個元素圖層的t在最底層,第二個元素的圖層在其之上,以此類推。

AudioTracks

AudioTrack[]

否,音頻軌為空白時,視頻軌必須非空。

音頻軌列表。

ImageTracks(圖片軌能力已相容合并至視頻軌 VideoTracks,圖片軌將不再迭代維護)

ImageTrack[]

否,存在圖片軌道時,視頻軌必須非空。

圖片軌列表。註:

1)圖片軌需疊加在視頻軌之上,圖片本身作為素材與視頻混編時(如圖片合成視頻情境),請使用視頻軌VideoTracks

2)多個軌道的層疊順序與數組元素順序一致,如:數組的第一個元素圖層的t在最底層,第二個元素的圖層在其之上,以此類推

SubtitleTracks

SubtitleTrack[]

字幕軌列表。

EffectTracks

EffectTrack[]

特效軌列表。

VideoTrack

視頻軌VideoTrack用於編排映像素材,包括視頻素材和圖片素材。

名稱

類型

是否必填

描述

Type

String

預設為普通視頻軌。

當Type=Effect時,當前軌道可當作特效軌使用,VideoTrackClips可填入EffectTrackItem

MainTrack

Boolean

用於指定當前軌道是否為主軌道。預設為 False。詳細介紹及樣本請參見設定主軌道

TrackShortenMode

String

若當前視頻軌道時間長度比主軌道時間長度長時,自適應縮短當前軌道,從而實現和主軌道對齊效果,支援設定:

  • AutoSpeed:對視頻自動做加速處理。

TrackExpandMode

String

若當前視頻軌道時間長度比主軌道時間長度短時,自適應擴充當前軌道,從而實現和主軌道對齊效果,支援設定:

  • AutoSpeed:對視頻自動做減速處理。

VideoTrackClips

VideoTrackClip[]

視頻軌素材片段列表。

AudioTrack

音頻軌AudioTrack用於編排音頻素材,包括純音頻素材和帶音訊視頻素材。

名稱

類型

是否必填

描述

MainTrack

Boolean

用於指定當前軌道是否為主軌道。預設為 False。詳細介紹及樣本請參見設定主軌道

TrackShortenMode

String

若當前音頻軌道時間長度比主軌道時間長度長時,自適應縮短當前軌道,從而實現和主軌道對齊效果,支援設定:

  • AutoSpeed:對音頻自動做加速處理。

TrackExpandMode

String

若當前音頻軌道時間長度比主軌道時間長度短時,自適應擴充當前軌道,從而實現和主軌道對齊效果,支援設定:

  • AutoSpeed:對音頻自動做減速處理。

AudioTrackClips

AudioTrackClip[]

音頻軌素材片段列表。

ImageTrack

重要

圖片軌能力已相容合并至視頻軌 VideoTrack,圖片軌將不再迭代維護

圖片軌ImageTrack用於編排圖片素材。

名稱

類型

是否必填

描述

ImageTrackClips(圖片軌能力已相容合并至視頻軌 VideoTrackClips,圖片軌將不再迭代維護)

ImageTrackClip[]

圖片軌素材片段列表。

SubtitleTrack

字幕軌SubtitleTrack用於編排字幕,包括橫幅文字和外掛字幕

名稱

類型

是否必填

描述

SubtitleTrackClips

SubtitleTrackClip[]

字幕軌素材片段列表。

EffectTrack

特效軌EffectTrack用於為視頻整體添加特效,支援濾鏡、VFX。

名稱

類型

是否必填

描述

EffectTrackItems

EffectTrackItem[]

特效軌片段列表。

VideoTrackClip

視頻軌素材VideoTrackClip的範圍包括視頻素材和圖片素材。

In、Out、TimelineIn、TimelineOut標記了對素材截取的位置以及素材在時間軸中的位置,如:想把一段視頻的5~10s放在時間軸15s~20s位置上,則:In=5, Out=10, TimelineIn=15, TimelineOut=20。

名稱

類型

是否必填

描述

MediaId

String

視頻軌素材片段對應的IMS內容庫媒資ID,或VOD媒資ID。

註:MediaId和MediaURL有且僅有一個不為空白。

MediaURL

String

視頻軌素材片段對應的OSS地址,格式為:

https://your-bucket.oss-cn-shanghai.aliyuncs.com/your-object.mp4

註:

  • MediaId和MediaURL有且僅有一個不為空白。

  • MediaURL 支援傳入「OSS 外網 Endpoint 地址」或者「其它公網可以訪問的地址」

Type

String

素材片段類型,預設Video。

取值:

  • Video(視頻)

  • Image(圖片)

  • GlobalImage(全域圖片,預設按照最長視頻軌時間計算該圖片時間長度。)

X

Float

表示圖片或視頻左上方距離輸出視頻左上方的橫向距離。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

Y

Float

表示圖片或視頻左上方距離輸出視頻左上方的縱向距離。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻高的佔比。當取值為>=2的整數時,表示絕對像素。

Width

Float

表示圖片在輸出視頻中的寬度。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

Height

Float

表示圖片在輸出視頻中的高度。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

AdaptMode

String

視頻尺寸自適應模式類型,預設為Fill,必須同時設定視頻軌道Width和Height,該模式才會生效,此時Width和Height為目的地區域寬高,視頻會在目的地區域內自適應縮放。

  • Contain:被替換的內容將被縮放,在填充目的地區域的同時保留其長寬比。

  • Cover:被替換的內容在保持其寬高比的同時填充整個目的地區域。如果對象的寬高比與內容框不相匹配,該對象將被剪裁以適應目的地區域。

  • Fill:預設邏輯,被替換的內容正好填充目標內容框。整個對象將完全填充此框。如果對象的寬高比與內容框不相匹配,那麼該對象將被展開以適應目的地區域。

In

Float

素材片段相對於素材的入點,在素材類型是音視頻時使用。單位:秒,精確到小數點後4位。如果In不填,預設為0。

Out

Float

素材片段相對於素材的出點,在素材類型是音視頻時使用。單位:秒,精確到小數點後4位。如果Out不填,預設為素材時間長度。

MaxOut

Float

素材片段相對於素材的最大出點值。如果設定該值,素材片段相對於素材的出點將會設定為素材時間長度與該值中的較小者。在素材為音視頻時使用。單位:秒,精確到小數點後4位。如果填入Out值,MaxOut值將失效。樣本:視頻軌中設定MaxOut

Duration

Float

素材片段的時間長度,一般在素材類型是圖片時使用。單位:秒,精確到小數點後4位。

DyncFrames

Int

動圖的幀數,在素材類型是圖片且為動圖時使用。樣本:使用GIF貼紙

TimelineIn

Float

素材片段相對於時間軸的入點。單位:秒,精確到小數點後4位。如果TimelineIn不填,則會按照素材片段順序相接的方式自動計算TimelineIn。

TimelineOut

Float

素材片段相對於時間軸的出點。單位:秒,精確到小數點後4位。如果TimelineOut不填,則會按照素材片段順序相接的方式自動計算TimelineOut。

Speed

Float

視頻素材速率,取值範圍0.1~100,如:Speed=2,則將視頻做2倍速處理,Clip的Duration減半,併合成到成片中。

Opacity

Float

視頻不透明度,取值範圍0~1,如:Opacity=0,表示完全透明;Opacity=1,表示完全不透明。

MaskVideoUrl

String

遮罩視頻地址。一般為帶 Alpha 通道的視頻,用於為原視頻添加透明通道效果。

  • 支援傳入「OSS 外網 Endpoint 地址」或者「其它公網可以訪問的地址」

ClipId

String

軌道對齊參數。其他音視頻軌道的素材如果設定了相同的ReferenceClipId,則其時間軸入出點與當前clip對齊。

參考文檔:素材與素材時間長度自動對齊

ReferenceClipId

String

軌道對齊參數。其他音視頻軌道的素材如果設定了相同的ClipId,則當前clip的時間軸入出點與其他軌道的素材對齊。

參考文檔:素材與素材時間長度自動對齊

Effects

Effect[]

素材片段的效果列表。

視頻軌素材由數字人(AI_Avatar)功能產生

通過添加 Type 為 AI_Avatar 的 VideoTrackClip,能夠直接產生數字人視頻用於剪輯。介紹及時間軸樣本參見:時間軸智慧工作提示平行處理

說明

此功能目前僅支援北京、上海、杭州地區可用。

名稱

類型

是否必填

含義

描述

Type

String

當前 Clip 類型

  • 固定值:AI_Avatar

MediaId

String

渲染數字人的音頻媒資 Id

  • 注意:MediaId、MediaURL 和 Content 有且僅有一個不為空白

MediaURL

String

渲染數字人的音頻檔案 URL

  • 注意:MediaId、MediaURL 和 Content 有且僅有一個不為空白

  • 支援傳入「OSS 外網 Endpoint 地址」或者「其它公網可以訪問的地址」

Content

String

渲染數字人的文字內容

  • 注意:MediaId、MediaURL 和 Content 有且僅有一個不為空白

  • 內容字數不得少於 5 個字

AvatarId

String

數字人形象 Id

Voice

String

聲音類型

CustomizedVoice

String

個人化人聲

  • 此處傳入您在人聲複製功能中訓練完成的 VoiceId,音頻即可使用您的個人化人聲進行產生

  • 如果傳入此值,Voice 將會失效

LoopMotion

Boolean

首尾同幀

  • 如果設定此值為 true,則產生的數字人視頻映像的首幀與尾幀相同,迴圈播放或前後拼接數字人視頻時人物形象的動作和表情不會有“跳變”現象。

  • 取值範圍:{true, false}

  • 預設值:false

SpeechRate

Integer

語速

  • 如果以 Content 作為輸入,可以用本欄位來設定聲音語速,取值範圍:[-500, 500],預設值:0。

    • [-500, 0,500] 對應的語速倍速區間為 [0.5, 1.0, 2.0]。

說明

計算方法如下:

  • 0.8倍速(1-1/0.8)/0.002 = -125

  • 1.2倍速(1-1/1.2)/0.001 = 166

小於1倍速時,使用0.002係數。

大於1倍速時,使用0.001係數。

實際演算法結果取近似值。

PitchRate

Integer

語調

  • 如果以 Content 作為輸入,可以用本欄位來設定聲音語調

  • 取值範圍:[-500, 500]

  • 預設值:0

說明

視頻軌素材由數字人(AI_Avatar)功能產生時的其他時間軸參數與一般的 VideoTrackClip 相同,參數詳情見前述 VideoTrackClip 參數詳情內容。

AudioTrackClip

音頻軌素材AudioTrackClip的範圍包括純音頻素材、有音頻流的視頻素材以及由文字直接轉化產生的語音。

In、Out、TimelineIn、TimelineOut標記了對素材截取的位置以及素材在時間軸中的位置,如:想把一段視頻的5~10s放在時間軸15s~20s位置上,則:In=5, Out=10, TimelineIn=15, TimelineOut=20。

說明

同一個音頻軌道上,各個音頻素材在時間軸上不要出現時間重疊的現象,否則可能會導致音頻異常。

音頻軌素材為純音頻素材或有音頻流的視頻素材

名稱

類型

是否必填

描述

MediaId

String

音頻軌素材片段對應的IMS內容庫媒資ID,或VOD媒資ID。

註:MediaId和MediaURL有且僅有一個不為空白。

MediaURL

String

音頻軌素材片段對應的OSS地址,格式為:

https://your-bucket.oss-cn-shanghai.aliyuncs.com/your-object.mp4

註:

  • MediaId和MediaURL有且僅有一個不為空白。

  • MediaURL 支援傳入「OSS 外網 Endpoint 地址」或者「其它公網可以訪問的地址」

In

Float

素材片段相對於素材的入點。單位:秒,精確到小數點後4位。如果In不填,預設為0。

Out

Float

素材片段相對於素材的出點。單位:秒,精確到小數點後4位。如果Out不填,預設為素材時間長度。

TimelineIn

Float

素材片段相對於時間軸的入點。單位:秒,精確到小數點後4位。如果TimelineIn不填,則會按照素材片段順序相接的方式自動計算TimelineIn。

TimelineOut

Float

素材片段相對於時間軸的出點。單位:秒,精確到小數點後4位。如果TimelineOut不填,則會按照素材片段順序相接的方式自動計算TimelineOut。

Speed

Float

音頻素材速率,取值範圍0.1~100,如:Speed=2,則將音頻做2倍速處理,Clip的Duration減半,併合成到成片中。

Effects

Effect[]

素材片段的效果列表

LoopMode

Boolean

素材片段在時間軸中迴圈播放效果。True:迴圈播放;False(預設值):正常不迴圈。

參考樣本:音頻迴圈播放

ClipId

String

軌道對齊參數。其他音視頻軌道的素材如果設定了相同的ReferenceClipId,則其時間軸入出點與當前clip對齊。

參考文檔:素材與素材時間長度自動對齊

ReferenceClipId

String

軌道對齊參數。其他音視頻軌道的素材如果設定了相同的ClipId,則當前clip的時間軸入出點與其他軌道的素材對齊。

參考文檔:素材與素材時間長度自動對齊

音頻軌素材直接由文字轉化產生

時間軸樣本請參考最佳實務:AI_TTS 文字轉語音並將語音合并到視頻中。目前僅支援北京、上海、杭州地區可用。

名稱

類型

是否必填

描述

Type

String

固定值:AI_TTS

Content

String

常值內容

Voice

String

智能語音效果樣本

CustomizedVoice

String

  • 個人化人聲

  • 此處傳入您在人聲複製功能中訓練完成的 VoiceId,音頻即可使用您的個人化人聲進行產生

  • 如果傳入此值,Voice 將會失效

Format

String

檔案格式,預設mp3。

支援PCM/WAV/MP3格式。

SpeechRate

Int

語速,取值範圍:-500~500,預設值:0。

  • [-500, 0, 500] 對應的語速倍速區間為 [0.5, 1.0, 2.0]。1倍速是指模型預設輸出的合成語速,語速會依據每一個發音人略有不同,大概每秒鐘4個字左右。

說明

計算方法如下:

  • 0.8倍速(1-1/0.8)/0.002 = -125

  • 1.2倍速(1-1/1.2)/0.001 = 166

小於1倍速時,使用0.002係數。

大於1倍速時,使用0.001係數。

實際演算法結果取近似值。

PitchRate

Int

語調,取值範圍:-500~500,預設值:0。

TimelineIn

Float

素材片段相對於時間軸的入點。單位:秒,精確到小數點後4位。如果TimelineIn不填,則會按照素材片段順序相接的方式自動計算TimelineIn

TimelineOut

Float

素材片段相對於時間軸的出點。單位:秒,精確到小數點後4位。如果TimelineOut不填,則會按照素材片段順序相接的方式自動計算TimelineOut

Effects

Effect[]

素材片段的效果列表

ClipId

String

軌道對齊參數。其他音視頻軌道的素材如果設定了相同的ReferenceClipId,則其時間軸入出點與當前clip對齊。

參考文檔:素材與素材時間長度自動對齊

ReferenceClipId

String

軌道對齊參數。其他音視頻軌道的素材如果設定了相同的ClipId,則當前clip的時間軸入出點與其他軌道的素材對齊。

參考文檔:素材與素材時間長度自動對齊

ImageTrackClip

重要

圖片軌能力已相容合并至視頻軌 VideoTrackClip,圖片軌將不再迭代維護

映像軌素材ImageTrackClip的範圍包括圖片素材。

名稱

類型

是否必填

描述

MediaId

String

圖片軌素材對應的媒資庫圖片資源MediaId,或VOD圖片媒資Id。

註:MediaId和MediaURL有且僅有一個不為空白。

MediaURL

String

圖片軌素材片段對應的OSS地址,格式為:https://your-bucket.oss-cn-shanghai.aliyuncs.com/your-object.mp4

註:

  • MediaId和MediaURL有且僅有一個不為空白。

  • MediaURL 僅支援傳入「OSS 外網 Endpoint 地址」

X

Float

表示圖片左上方距離輸出視頻左上方的橫向距離。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

Y

Float

表示圖片左上方距離輸出視頻左上方的縱向距離。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻高的佔比。當取值為>=2的整數時,表示絕對像素。

Width

Float

表示圖片在輸出視頻中的寬度。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

Height

Float

表示圖片在輸出視頻中的高度。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻高的佔比。當取值為>=2的整數時,表示絕對像素。

TimelineIn

Float

圖片出現在時間軸的起始位置。單位:秒,精確到小數點後4位。如果TimelineIn不填,預設值為0

TimelineOut

Float

圖片出現在時間軸的結束位置。單位:秒,精確到小數點後4位。如果TimelineOut不填,預設值為視頻軌的最大時間長度

DyncFrames

Int

動圖的幀數,在素材為動圖時必填。樣本:使用GIF貼紙

Effects

Effect[]

素材的效果列表

SubtitleTrackClip

字幕軌素材SubtitleTrackClip的範圍包括字幕素材。

說明

同一個字幕軌道上,各個字幕Clip在時間軸上盡量不要出現時間重疊的現象,否則可能會導致字幕位置異常等問題。

名稱

類型

是否必填

描述

Type

String

字幕素材類型。取值:

SubType

String

字幕素材子類型。取值:

  • srt 外掛srt字幕

  • ass 外掛ass字幕

字幕素材類型為橫幅文字時,可忽略該欄位。

FileURL

String

字幕檔案對應的OSS地址。當字幕類型為外掛字幕時必填。格式為:

https://your-bucket.oss-cn-shanghai.aliyuncs.com/your-object.srt

註:

  • FileURL 支援傳入「OSS 外網 Endpoint 地址」或者「其它公網可以訪問的地址」

樣本:外掛字幕

X

Float

當字幕類型為橫幅文字時,表示文字左上方距離輸出視頻左上方的橫向距離。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

Y

Float

當字幕類型為橫幅文字時,表示文字左上方距離輸出視頻左上方的縱向距離。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻高的佔比。當取值為>=2的整數時,表示絕對像素。

TimelineIn

Float

當字幕類型為橫幅文字時,表示文字出現在時間軸的起始位置。單位:秒,精確到小數點後4位。如果TimelineIn不填,則會按照素材順序相接的方式自動計算TimelineIn

TimelineOut

Float

當字幕類型為橫幅文字時,表示文字出現在時間軸的結束位置。單位:秒,精確到小數點後4位。如果TimelineOut不填,則會按照素材順序相接的方式自動計算TimelineOut

ClipId

String

軌道對齊參數。其他音視頻字幕軌道的素材如果設定了相同的ReferenceClipId,則其時間軸入出點與當前clip對齊。

  • 該字幕Clip必須設定了TimelineIn和TimelineOut參數,或者使用了字幕滾動時間長度自適應能力。

ReferenceClipId

String

軌道對齊參數。其他音視頻字幕軌道的素材如果設定了相同的ClipId,則當前Clip的時間軸入出點與其他軌道的素材對齊。

Content

String

當字幕類型為橫幅文字時必填,表示文字內容。

Font

String

當字幕類型為橫幅文字時,表示文字的字型。預設為SimSun,宋體。具體支援的字型列表參見:字型列表

FontSize

Int

當字幕類型為橫幅文字時,表示文字的字型大小。預設為0,最大支援設定到5000。

SizeRequestType

String

當字幕類型為橫幅文字時,表示將文字字型大小到實際文字渲染大小的計算方式,預設處理方式為RealDim。

  • Nominal:字幕渲染高度(像素值)等於字型大小FontSize

  • RealDim:在某些字型上,字幕渲染高度(像素)可能會小於字型大小FontSize

FontColor

String

當字幕類型為橫幅文字時,表示文字的顏色,格式為#後跟16進位值。例如:#ffffff。

FontColorOpacity

Float

當字幕類型為橫幅文字時,表示文字的透明度,取值0-1,預設1。1為不透明,0為完全透明。

FontFace

FontFace

當字幕類型為橫幅文字時,表示文字的字型外觀。

Spacing

Int

當字幕類型為橫幅文字時,表示橫幅文字字間距。單位:像素值,預設為0。

LineSpacing

Int

當字幕類型為橫幅文字時,表示橫幅文字行間距。單位:像素值,預設為0。

Angle

Float

當字幕類型為橫幅文字時,表示橫幅文字逆時針旋轉角度。單位:度,預設為0。

BorderStyle

Int

設定橫幅文字邊框和陰影格式。取值1或3,1=邊框+陰影,3=不透明底框。預設為1。

Outline

Int

當字幕類型為橫幅文字時,表示橫幅文字描邊寬度。單位:像素值,預設為0。

OutlineColour

String

當字幕類型為橫幅文字時,表示橫幅文字描邊顏色,格式為#後跟16進位值。例如:#ffffff。

Shadow

Int

當字幕類型為橫幅文字時,表示橫幅文字投下陰影的深度,單位:像素值,預設為0。

BackColour

String

當字幕類型為橫幅文字時,表示橫幅文字陰影顏色,格式為#後跟16進位值。例如:#ffffff。

Alignment

String

當字幕類型為橫幅文字時,用於設定定位對齊,預設為TopLeft,支援設定:

  • TopLeft:視頻左上方

  • TopCenter:視頻豎直中軸線上側

  • TopRight:視頻右上方

  • CenterLeft:視頻水平中軸線左側

  • CenterCenter:視頻中心位置

  • CenterRight:視頻水平中軸線右側

  • BottomLeft:視頻左下角

  • BottomCenter:視頻豎直中軸線下側

  • BottomRight:視頻右下角

若需要在不同對齊下準確定位字幕位置,建議設定以下對齊:

  • Left,靠左對齊,X、Y傳入字幕左上方頂點相對於視頻左上方的座標

  • Center,置中對齊,X、Y傳入字幕中軸線上邊界交點相對於視頻左上方的座標

  • Right,靠右對齊,X、Y傳入字幕右上方頂點相對於視頻左上方的座標

AdaptMode

String

橫幅文字當超出視頻寬度或超出指定TextWidth時進行自動換行或縮放:

  • AutoWrap:自動換行

  • AutoScale:自動縮放

  • AutoWrapAtSpaces:只在空格位置自動換行(適用於純英文字幕自動換行情境)

  • AutoWrapAtSpacesStrict:在空格位置處,應嚴格遵循邊界進行換行,避免字數的不均勻分配。通過限定邊距,當達到邊距長度時進行換行。

TextWidth

Float

字幕文字框寬度,當設定AdaptMode時生效。將按照該值設定文字框寬度進行自動換行或縮放。不填寫時,會按照視頻寬度進行自動換行或縮放。當值大於0小於等於1時,表示相對輸出視頻的寬度,當值大於1時,表示絕對像素值。

FontUrl

String

當字幕類型為橫幅文字時,支援使用使用者OSS的字型檔路徑來產生字幕,支援ttf、otf、woff三種格式的字型檔。例如:https://your-bucket.oss-cn-shanghai.aliyuncs.com/example-font.ttf.

EffectColorStyle

String

當字幕類型為橫幅文字時,表示橫幅文字花字樣式類型。花字種類及效果見:花字效果樣本

SubtitleEffects

SubtitleEffect[]

當字幕類型為橫幅文字時,表示文字多層效果。目前支援設定多層描邊、多層陰影、高斯模糊效果(高斯模糊僅支援在類型為陰影時使用)和字幕背景效果。

註:

  • 如果設定SubtitleEffects時,字幕軌道中Outline、Shadow欄位不會再生效;

  • 當設定多層描邊/陰影/背景效果時,SubtitleEffects數組的順序展示層級順序,數組中第一個SubtitleEffect會渲染在最底層,數組中最後一個SubtitleEffect會渲染在最上層;

ScrollStartY

Float

配置字幕滾動效果時,表示字幕向上或者向下滾動的起點Y座標,單位:像素值,如果小於1表示相對輸出視頻的高度。

ScrollEndY

Float

配置字幕滾動效果時,表示字幕向上或者向下滾動的終點Y座標,單位:像素值,如果小於1表示相對輸出視頻的高度。

ScrollSpeed

Float

配置字幕滾動效果時,表示字幕每秒向上或向下滾動的速度,單位:像素/s。

ScrollStartShift

Float

配置字幕縱向滾動時生效,表示字幕向上或者向下滾動位置相比起點位置的位移量,單位:像素值,如果小於1表示相對輸出視頻的高度。

ScrollEndShift

Float

配置字幕縱向滾動時生效,表示字幕向上或者向下滾動位置相比終點位置的位移量,單位:像素值,如果小於1表示相對輸出視頻的高度。

ScrollStartFreeze

Float

配置字幕縱向滾動時生效,表示字幕向上或者向下滾動在起點位置的靜止時間,單位:s。

ScrollEndFreeze

Float

配置字幕縱向滾動時生效,表示字幕向上或者向下滾動在終點位置的靜止時間,單位:s。

ScrollDirection

String

配置字幕橫向滾動效果時生效,表示字幕的滾動方向,支援:

  • Left:向左滾動

  • Right:向右滾動

ScrollStartX

Float

配置字幕橫向滾動效果時,表示字幕向左或者向右滾動的起點X座標,單位:像素值,如果小於1表示相對輸出視頻的高度。

ScrollEndX

Float

配置字幕橫向滾動效果時,表示字幕向左或者向右滾動的終點X座標,單位:像素值,如果小於1表示相對輸出視頻的高度。

ScrollLoop

Boolean

配置字幕橫向滾動時生效,表示是否迴圈滾動顯示。

AaiMotionInEffect

String

當字幕類型為橫幅文字時,表示橫幅文字入場特效類型。字幕入場特效種類及效果見:字幕特效樣本

AaiMotionIn

Float

當字幕類型為橫幅文字時,表示橫幅文字入場特效時間長度。單位:秒,精確到小數點後4位,如果AaiMotionIn不填,預設0.5s,如果文本時間長度小於0.5,則為總時間長度減去出場時間長度。

AaiMotionOutEffect

String

當字幕類型為橫幅文字時,表示橫幅文字出場特效類型。字幕出場特效種類及效果見:字幕特效樣本

AaiMotionOut

Float

當字幕類型為橫幅文字時,表示橫幅文字出場特效時間長度,單位秒,精確到小數點後4位,如果AaiMotionOut不填,預設0.5s,如果文本時間長度小於0.5,則為總文本時間長度。

AaiMotionLoopEffect

String

當字幕類型為橫幅文字時,表示橫幅文字迴圈特效類型,不可與字幕入場或者出場特效同時生效。迴圈特效種類以及效果見:字幕特效樣本

Ratio

Float

當字幕類型為橫幅文字時,表示橫幅文字迴圈特效播放速度,精確到小數點後4位。不填預設為1,大於1表示加速迴圈,小於1表示慢速迴圈。

TextureURL

String

當字幕類型為橫幅文字時,表示字幕紋理效果,支援PNG、JPG、JPEG、BMP格式,目前僅支援傳入OSS檔案,例如https://your-bucket.oss-cn-shanghai.aliyuncs.com/your-image.png

BubbleStyleId

String

當字幕類型為橫幅文字時,表示橫幅文字氣泡字樣式類型。氣泡種類及效果見:氣泡字樣本

BubbleWidth

Float

僅在使用氣泡字時生效,表示氣泡底圖相對於輸出視頻的寬,大於1表示絕對像素值,小於等於表示相對值。

BubbleHeight

Float

僅在使用氣泡字時生效,表示氣泡底圖相對於輸出視頻的高,大於1表示絕對像素值,小於等於表示相對值。

EffectTrackItem

特效軌片段EffectTrackItem,類型包括VFX、濾鏡。

名稱

類型

是否必填

描述

Type

String

特效軌片段類型,支援:VFX、Filter。

SubType

String

特效軌片段子類型,詳細見:

特效效果樣本

濾鏡效果樣本

TimelineIn

Float

特效片段出現在時間軸的起始位置。單位:秒,精確到小數點後4位。如果TimelineIn不填,則預設為0。

TimelineOut

Float

特效片段出現在時間軸的結束位置。單位:秒,精確到小數點後4位。如果TimelineOut不填,則預設為視頻結束時間。

Duration

Float

特效片段出現在時間軸的持續時間長度。單位:秒,精確到小數點後4位。如果Duration不填,則預設為視頻時間長度。

Duration和TimelineOut僅有一個生效。

X

Float

該欄位僅支援SubType為mosaic_rect/blur的情況。特效地區左上方距離輸出視頻左上方的橫向距離。

註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

Y

Float

該欄位僅支援SubType為mosaic_rect/blur的情況。

特效地區距離輸出視頻左上方的縱向距離。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻高的佔比。當取值為>=2的整數時,表示絕對像素。

Width

Float

該欄位僅支援SubType為mosaic_rect/blur的情況。特效地區在輸出視頻中的寬度。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻寬的佔比。當取值為>=2的整數時,表示絕對像素。

Height

Float

該欄位僅支援SubType為mosaic_rect/blur的情況。特效地區在輸出視頻中的高度。註:支持度百分比和像素兩種形式。當取值為[0~0.9999]時,表示相對輸出視頻高的佔比。當取值為>=2的整數時,表示絕對像素。

SubtitleEffect

字幕描邊/陰影製作效果

名稱

類型

是否必填

描述

Type

String

-Outline:描邊

-Shadow:陰影

-Box:字幕底框

Bord

Float

描邊/陰影寬度或高度,當大於1時,表示像素值,當大於0小於1時,表示相對文字大小的寬度或高度。

XBord

Float

描邊/陰影寬度,當大於1時,表示像素值,當大於0小於1時,表示相對文字大小的寬度,優先順序高於Bord。

YBord

Float

描邊/陰影高度,當大於1時,表示像素值,當大於0小於1時,表示相對文字大小的高度,優先順序高於Bord。

Shift

Float

描邊/陰影左右/上下位移量,當絕對值大於1時,表示像素值,當絕對值大於0小於1時,表示相對文字大小的位移量,支援設定負數,效果為向上/左位移。

XShift

Float

描邊/陰影左右位移量,當絕對值大於1時,表示像素值,當絕對值大於0小於1時,表示相對文字大小的左右位移量,優先順序高於Shift。

YShift

Float

描邊/陰影上下位移量,當絕對值大於1時,表示像素值,當絕對值大於0小於1時,表示相對文字大小的上下位移量,優先順序高於Shift。

Color

String

RGB顏色,格式為#後跟16進位值。例如:#ffffff。

Opacity

String

不透明度,1為完全不透明,0為完全透明。

Blur

Float

高斯模糊範圍,像素值,僅支援在Type=Shadow時使用,可以實現字幕外光暈效果。

Radius

Float

文字純色背景圓角半徑,僅支援在Type=Box時使用,可以實現字幕背景圓角效果。

ImageUrl

String

自訂字幕背景底圖,僅支援在Type=Box時使用,可實現自訂氣泡字效果,可使用BubbleWidth或BubbleHeight欄位調整字幕大小,支援PNG、JPG、JPEG、BMP格式,目前僅支援傳入OSS檔案,例如https://your-bucket.oss-cn-shanghai.aliyuncs.com/your-image.png。

Width

Float

當使用自訂氣泡字時必填,氣泡底圖源檔案寬。

Height

Float

當使用自訂氣泡字時必填,氣泡底圖源檔案高。

TextArea

String

當使用自訂氣泡字時必填,表示文字在氣泡底圖中的地區,由4個[0, 1]的浮點數用逗號拼接組成,比如傳入"0.1,0.2,0.8,0.6",表示字幕文字框左上方座標相對氣泡的位置為0.1和0.2,字幕文字框相比氣泡的寬高分別為0.8和0.6。

FontFace

字型樣式FontFace

名稱

類型

是否必填

描述

Bold

Boolean

加粗

Italic

Boolean

斜體

Underline

Boolean

底線

Effect

素材效果Effect

不同的效果類型,有不同的屬性可以設定,同時有一些共通的屬性。

各類 Effect 的獨立屬性描述,詳見 Effect配置說明

Effect 通用屬性如下:

名稱

類型

是否必填

描述

Type

String

效果類型。取值如下:

  • Text(橫幅文字:視頻軌素材)

  • DeWatermark(模糊:視頻軌素材)

  • Crop(裁剪:視頻軌素材)

  • Pad(貼邊:視頻軌素材)

  • Scale(縮放:視頻軌素材)

  • Transition(轉場:視頻軌素材)

  • VFX(特效:視頻軌素材)

  • Volume(音量調整:音頻軌素材)

  • AFade(音頻淡入淡出:音頻軌)

  • AI_ASR(識別音頻產生字幕:視頻軌、音頻軌素材)

SubType

String

效果子類型