构建优质实时音视频互动体验
阿里云实时音视频(ApsaraVideo Real-time Communication)依托阿里云全球实时通信网络,核心音视频编解码技术,在传统直播基础上加入了更多互动元素,如语音聊天 、视频连麦、游戏互动等。通过端到端超低延时、上下麦平滑切换等关键能力,解决传统直播以单向内容传播为主,观众参与度和商业转换效率低的痛点,让观众不仅是观看者,也可以随时成为参与者。适用于在线教育、互动娱乐、音视频社交等场景。
实时音视频(ApsaraVideo Real-time Communication)借助视频云智能降噪算法、窄带高清™编码技术、实时传输算法族等多项核心技术,可以在网络丢包的弱网环境、多噪音场景下提供清晰流畅的优质音视频互动体验。
多网合一
依托阿里云 GRTN 品牌网络,全球覆盖 3200+ 节点,支持直播网络和WebRTC 网络资源复用 ,保证弱网下的用户体验,实现全球高可靠服务。
实时互动
基于WebRTC链路可提供延时300ms以内的实时音视频互动,支持频道内连麦和跨频道连麦互动,观众可自由平滑上下麦,切换过程无需等待。
超高质量体验
优秀的 3A 音频处理引擎,48kHz 全频带采样支持。支持 720P、1080P 高清画质,提供优质稳定的互动通话体验。
丰富的媒体处理能力
提供丰富的媒体处理能力,涵盖录制、混流、转码、审核等。
易于接入
提供场景化集成方案及组件,支持低代码集成,另有完善的最佳实践助力开发者快速接入。
多终端支持
支持Android、iOS、Web多终端音视频连麦,用户可通过不同平台随时开启互动直播体验。
产品架构
实时音视频(ApsaraVideo Real-time Communication)互动链路采用 WebRTC 协议保证麦上互动的实时性,结合托管型房间管理组件,能够让麦下用户和麦上用户享有相同的超低延时。通过旁路转推直接对接阿里云媒体处理中心,提供录制、转码、混流、内容审核、对接第三方审核等配套能力。同时也可以无缝扩展标准直播,CDN 直播观众可通过 RTS/FLV/RTMP/HLS 协议拉流,不限制并发人数 ,无需加入房间组件。
产品能力
优秀的音视频处理能力和完备的质量监控
基于阿里云自研的音频预处理、视频编解码器、弱网对抗算法、数据监控大盘,确保优质的音视频体验和全面的质量监测。
视频互动
支持 480P、720P、1080P 等分辨率的多人视频互动,端到端延时 300ms 内,可用于直播间主播与观众连麦、主播跨房间 PK 等多种应用场景。
语音互动
支持 48KHz 高音质语音互动,端到端延时 300ms 内,可用于语聊房、KTV 等多样场景。
音频处理
支持背景音乐播放,音乐和人声混音,耳返,降噪等音频处理。
智能降噪
在高保真还原人声前提下,智能消除周边噪音、抑制突发噪音、消除多设备啸叫。
质量监测
通过对海量音视频质量数据采集与分析,实现多维度多层次的质量监测。
丰富多样的业务功能和灵活的接口配置
面向各类企业应用,提供多样的产品功能和灵活的接口配置助力客户快速搭建实时音视频通信场景。
混流转推
支持将多路流按照一定规则进行混流,并支持转推至阿里云直播或第三方。
CDN直播联动
无缝联动标准直播、超低延时直播,支持麦上麦下平滑切换,可实现麦下10万+用户并发观看。
云端录制
将音视频通话画面同步到云端进行云端混流,并将混流后的频道内容进行录制保存。
云端转码
可以将各路音视频流进行画面混合、音视频转码,针对画面中不同内容进行不同策略的编码优化,使得整个画面更具层次感。
安全审核
支持无缝对接阿里云视频和语音审核,或手动对接第三方审核。
应用场景
双人音视频通话
支持 720P、1080P 的高清画质及 48kHz 高音质,通话时延低于300ms,打造流畅、高品质的语音通话体验。提供双人音视频通话的 UI 组件,可直接复用。后台服务提供源码,支持集成方二次开发,满足个性化功能需求。
能够提供
-
低门槛接入提供丰富的场景化 UI 组件,可快速实现双人音视频通话场景,最大程度降低开发成本。
-
稳定可靠基于阿里云多年全球网络服务的经验,提供端到端的弱网对抗能力,弱网环境下,仍然能够有效保障业务稳定运行。
-
高品质体验支持 720P、1080P 高清画质及 48 kHz 高音质,打造清晰和沉浸式的互动体验。
推荐搭配使用
多人音视频通话
单个房间最多可支持 50 人同时在线进行音视频通话,支持 720P、1080P 的高清画质及 48 kHz 高音质。提供多人音视频通话的 UI 组件,可直接复用。后台服务提供源码,支持集成方二次开发,满足个性化功能需求。
能够提供
-
低门槛接入提供丰富的场景化 UI 组件,可快速实现多人音视频通话场景,最大程度降低开发成本。
-
稳定可靠基于阿里云多年全球网络服务的经验,提供端到端的弱网对抗能力,弱网环境下,仍然能够有效保障业务稳定运行。
-
高品质体验支持 720P、1080P 高清画质及 48 kHz 高音质,打造清晰和沉浸式的互动体验。
推荐搭配使用
语音聊天室
由房主、主播、观众三种角色组成,其中房主与主播之间可以实时语音通话,观众可以上麦成为主播参与语音互动。
能够提供
-
低延迟音频互动依托阿里云 GRTN 品牌网络,全球覆盖 3200+ 节点,构建的低延迟传输网络,保障主播和主播、主播和观众间的低延迟互动效果。
-
麦位和权限管理提供数据传输通道,供业务实现麦位、权限管理等功能。
-
调音器提供音量调整、混音比例调整、美声变声等功能。支持调整本人和房间内其他主播的声音效果。
-
背景音乐输入提供外部背景音乐的输入,支持常见格式的数据解码。
-
录制本端直接将数据实时输出和本地直接录制的能力。
推荐搭配使用
在线KTV
还原线下 KTV 场景,用户可在线进行歌曲独唱、合唱、倾听等互动功能,实现线上 KTV 互动新玩法。
能够提供
-
超低延时保障稳定的音频传输技术,保障用户低延迟的沉浸 K 歌体验。
-
歌词组件根据进度显示歌词,开源组件代码,方便客户自主定制。
-
实时合唱支持多人合唱,伴奏精准同步,达到线下 K 歌的效果。
-
歌单管理和麦位管理提供数据传输通道,供业务实现歌单管理、麦位管理等功能。
-
歌曲控制主唱可以实时控制歌曲的播放状态,歌单管理,并且可以实现实时地将状态同步给其他演唱者和观众。
-
调音器提供音量调整、混音比例调整、美声变声等功能。
-
低延时耳返适配大量设备,实现低延迟耳返,给演唱者及时的反馈。