全部產品

Platform For AI：LVM-幀文本產生（DLC）

更新時間：Nov 08, 2024

LVM-幀文本產生（DLC）組件主要用於產生視頻（僅支援處理MP4格式的視頻）文本。

支援的計算資源

演算法說明

通過採樣若干視訊框架，由BLIP模型基於視訊框架產生視頻文本。

輸入/輸出

輸入樁

通過讀OSS資料組件，讀取訓練資料所在的OSS路徑。
配置此演算法參數視頻資料OSS路徑，選擇視頻資料所在的OSS目錄，或視頻中繼資料檔案。詳情請參見下文中的參數說明。
使用任意LVM資料處理（DLC）組件作為輸入。

輸出樁

輸出結果。詳情請參見下文中的參數說明。

配置組件

在Designer工作流程頁面添加LVM-幀文本產生（DLC）組件，並在介面右側配置相關參數：

參數類型	參數		是否必選	描述	預設值
欄位設定	視頻資料OSS路徑		否	首次運行時，若無上遊組件，需手動選擇視頻資料所在的OSS目錄。運行時會在該路徑的上一級目錄下產生視頻中繼資料檔案video_meta.jsonl。後續處理此視頻資料時，也可以直接選擇之前產生的video_meta.jsonl檔案。	無
	輸出檔案的OSS路徑		是	產生結果的儲存目錄。包含以下檔案： {name}.jsonl：結果檔案，即下面參數輸出的檔案名稱。 dj_run_yaml.yaml：演算法運行時的參數設定檔。	無
	輸出的檔案名稱		是	產生結果的檔案名稱。	result.jsonl
參數設定	產生候選文本數目		是	每幀產生的候選文本數。	1
參數設定	均勻採樣幀數目		是	採樣的視訊框架數。系統會在視頻中根據視頻時間長度均勻地採集幀畫面進行分析。	3
執行調優	選擇資源群組	公用資源群組	否	選擇節點規格（CPU或GPU執行個體規格）、專用網路。該演算法需使用GPU規格執行個體。	無
	選擇資源群組	專有資源群組	否	選擇CPU核心數、記憶體、共用記憶體、GPU卡數。	無
	最大運行時間長度		否	組件最大運行時間長度，超過這個時間，作業會被終止。	無