本文主要介绍媒资解决方案现在支持配置的功能节点及节点特性。节点名称节点说明人脸识别支持输入多个演员图片、演员名字、扮演角色信息,自动检测工作流中人脸信息,识别对应人物出现的时间点。提取语音 + ASR支持从音视频中分离人声并进行高精度语音识别(ASR),生成带时间戳和对应讲话者的文本字幕。文本内容提取支持选择模型,配置 Prompt 并定义输出格式,通过文本提取技术识别视频中的文字信息,结合 ASR 文本,构建完整语义理解。视频摘要(OTT)支持定义帧间隔/相似度,通过画面识别+字幕读取的方式,面向视频(电影、电视剧、短视频等)智能生成摘要和总结。抽帧检测(Custom)支持定义帧间隔/相似度,并选择模型,配置对应的Prompt和输出格式,检测视频画面中的画面质量、画面内容结果等。