帮助开发者快速高效开发音视频应用
音视频终端 SDK(MediaBox SDKs)集成了直播推流、视频播放、短视频创作、美颜特效、音频特效等核心能力,搭配开源 UI 组件和产品级 Demo,支持您根据业务需求集成所需 SDK 以及采用低代码方式快速搭建所需应用。
节省体积
融合直播和点播核心能力,复用核心组件,节省50%以上的包体积
高效集成
一次性批量接入多个功能模块,提升集成效率,节省研发对接成本
接入灵活
按照业务需要自由组合功能模块,按需打包贴合业务场景
简单易用
产品级 Demo 提供直播、点播全功能能力,贴合业务实践需要,便于快速整合
服务多样
播放质量监控功能提供完善的指标体系确保服务质量,音视频 AI 提升音视频利用和分发效率
功能稳定
经过数亿级请求量的打磨,音视频服务质量稳定可靠,为您提供流畅清晰的体验
产品功能
播放器 SDK
阿里云播放器 SDK 是阿里云自研的全端音视频播放工具,播放器 SDK 具有集成便捷、全端覆盖、播放性能优秀等特点。同时提供丰富多样的播放玩法,多样化的视频安全方案支持和完善的播放数据服务,为您提供云端协同的优质播放体验。
全平台覆盖一次性集成
播放器 SDK 支持 Web、Android、iOS、Flutter、Windows、macOS 和 Linux 等平台,有效支撑多屏播放的业务场景,满足您的多样需求。播放器 SDK 在不同平台下提供统一的接口设计,显性降低开发者跨平台集成的工作量。
稳定流畅的播放体验
播放器 SDK 质量稳定可靠,轻松支撑过亿每日播放vv(video view)、秒开率大于 85%、百秒卡顿时长小于 100ms。综合播放策略、设备适配软硬解方案确保播放流畅性。
复合视频安全方案支持
视频点播提供标准加密、阿里云视频加密(私有加密)和 DRM 加密方案,播放器 SDK 支持上述方案的加密解码,有效解决恶意下载扩散等侵权问题
推流 SDK
阿里云推流 SDK 是基于阿里云强大内容分发网络和音视频实时通讯技术的客户端推流开发工具,支持 Android、iOS、Flutter 多端多平台推流,为您提供简单易用的开放接口、网络自适应的流畅体验、多节点的低延迟优化、功能强大的实时美颜等服务。
直播推流
支持 RTMP 协议直播推流,并支持 RTMP、FLV、HLS、ARTC 直播拉流协议,分辨率支持 180P~720P;支持横屏、镜像、纯音频、静音、后台等多种推流方式。
超低延时直播
提供基于 UDP 协议的 WebRTC 推流,且控制台支持自助开通 WebRTC 推流域名,优秀的弱网抗性,带给您毫秒级超低延迟直播体验。
直播连麦
提供基于实时音视频 RTC 的直播连麦解决方案,帮助您实现超低延时、更多人数的直播实时互动。
短视频 SDK
阿里云短视频 SDK 是集短视频录制、裁剪、编辑、上传等功能于一体的开发者工具。短视频 SDK 提供易用、稳定、统一的接口和开源产品级的 UI 界面,您可以根据自己的业务搭建短视频相关功能,还可以基于开源的 UI 界面完成界面定制,实现个性化的二次开发。
视频录制
支持多端录制、变速、清晰度、屏比等多种拍摄设置;支持实时水印、实时滤镜、实时特效、实时美颜、合拍等多种录制方式;同时支持多路混音、回声消除、音频降噪等。
视频模板
支持在编辑界面添加 MV 效果,切换 MV,可引导您选择相应的视频或图片,根据设计好的 AE 模板结构进行视频的合成,批量剪辑同款视频。
动图字幕
支持动图、普通字幕、气泡字幕、花字、翻转字幕等。
美颜特效 SDK
阿里云美颜特效 SDK 是基于自研的智能视觉算法、海量规模的人脸人体检测和识别技术提供的美颜特效功能。支持画面美化、人像美颜、抠像制作、贴纸美妆、动作识别、美体、美发、AR 隔空写字等各种个性化定制服务。
动作检测
基于自研的算法技术,支持人体 18 个关键点位的实时精准检测,可识别直立、举手、比心、叉腰、超人等 13 种静态姿势识别,同时还支持跳绳、开合跳、深蹲、俯卧撑、仰卧起坐等 9 种动态动作检测,并实时提供计数反馈。
实时风格滤镜
支持数十款滤镜效果,并持续更新素材库。实时渲染处理,让视频场景瞬间变美变好看,满足各类视频场景处理需求。实时渲染画面处理,效果自然贴合场景。持续扩展的滤镜素材库与效果调优。
动态贴纸
基于人脸关键点技术和智能算法,贴纸精准贴合面部,并可根据面部表情动作变化实时跟随。贴纸支持静态、动态,并会持续扩容素材库,为视频场景提升生动性、趣味性、互动性。
蓝/绿幕抠像
支持蓝色和绿色背景幕布抠像。精准识别人体,与背景精细分割,支持多光线、正侧面等复杂环境的抠像,并实时跟随。
AR 隔空写字
通过手势识别算法识别出手指关键点的轨迹,同时通过判断您的手处于落笔或抬笔的状态信息,把您写的内容渲染在视频内,从而实现 AR 隔空书写的效果。可广泛应用于直播、教学、在线互动等各种场景。
人脸美颜
整体智能美颜包括 5 档,手动美颜支持美白、磨皮、锐化、美肤、眼袋、祛法令纹、白牙 7 项功能,每项功能参数可调。
音频特效 SDK
音频特效 SDK 致力于泛娱乐影视体验、音视频实时通信、音乐理解与处理等场景音频技术的应用,通过音频技术为您提供优质的音视频交互体验。
全景声
提供全景声内容的生产-消费全链路技术。将全景声音频(Ambisonics 格式)通过独有的双耳渲染技术转换为含有全部空间信息的双声道音频,在 VR 头显以及具有陀螺仪的手机设备上实现自由视角下,声像始终保持统一,人转动,声源位置不动的沉浸式体验,可用于 VR 直播,VR 点播等场景。
环绕声
提供影视中音频内容的环绕声渲染技术。在两声道立体声的设备上,通过独有的声学算法对 5.1/7.1 等多声道及立体声影片进行耳机、外放的虚拟环绕渲染,使您可以在耳机或外放上感受到从四面八方传来的声音,带来饱满的,有层次感和方向感的影院级听觉体验。
人声增强
提供高质量的人声增强技术。在不改变音色的前提下,将影视中的对白部分进行凸显,使嘈杂场面中的对白更加清晰明亮,使您不再错过精彩内容。
应用场景
MediaBox音视频SDK主流业务场景主要分为音视频播放、直播推流与连麦互动、短视频创作和美颜特效。