产品能力说明 - SuperApp

本文主要介绍媒资解决方案现在支持配置的功能节点及节点特性。

节点名称	节点说明
人脸识别	支持输入多个演员图片、演员名字、扮演角色信息，自动检测工作流中人脸信息，识别对应人物出现的时间点。
提取语音 + ASR	支持从音视频中分离人声并进行高精度语音识别（ASR），生成带时间戳和对应讲话者的文本字幕。
文本内容提取	支持选择模型，配置 Prompt 并定义输出格式，通过ASR 文本和抽帧检测的画面理解结果，进行跨模态的文本信息提取和完整语义理解。
视频摘要（OTT）	支持定义帧间隔/相似度，通过画面识别的方式，面向视频（电影、电视剧、短视频等）智能生成摘要和总结。
抽帧检测（Custom）	支持定义帧间隔/相似度，并选择模型，配置对应的Prompt和输出格式，检测视频画面中的画面质量、画面内容结果等。