従来のライブストリーミングは一方向のコンテンツ配信に重点を置いているため、視聴者のエンゲージメントやコンバージョン率が低いという課題がありました。ApsaraVideo Real-time Communication (ARTC) は、音声チャット、映像共同ストリーミング、ゲームインタラクションなどのインタラクティブ機能を通じて、受動的な視聴者を能動的な参加者へと変えます。
アーキテクチャ
ARTC は、高度な技術アーキテクチャとアルゴリズムに基づき、開発者や企業に効率的で安定した、使いやすい SDK と API を提供します。iOS、Android、Web、Windows などのプラットフォーム間でシームレスな統合をサポートします。さらに、ARTC を他の Alibaba Cloud サービスと組み合わせることで、より幅広いユースケースに対応するソリューションを構築できます。
ユースケース
音声チャット
最大 50 人の同時発話をサポートし、エンドツーエンドの遅延は 150~400 ms です。ボイスチェンジャー、リバーブ、音声強調など、さまざまな音声機能を利用できます。コンテンツコンプライアンスのために、ARTC はコンテンツモデレーションサービスを提供し、サードパーティ連携もサポートしています。シナリオベースのソリューションについては、「音声チャットルーム」、「オンラインカラオケ」、「1 対 1 の音声・ビデオ通話」をご参照ください。
共同ストリーミング
ARTC は共同ライブストリーミングをサポートしており、視聴者はライブコンテンツと並行してストリーマーとチャットしたり、異なるルームのストリーマーが人気ベースの対戦を行ったりできます。エンドツーエンドの遅延は 150~400 ms で、視聴者はライブストリームにシームレスに参加・退出できます。さらに、標準ストリーミングとリアルタイムストリーミング (RTS) の両方をサポートし、10 万人以上の同時視聴者数を実現します。詳細については、「マルチホストストリーミング」をご参照ください。
共同ストリーミング
| ストリーマー対戦
|
リアルタイム対話型 AI
リアルタイム対話型 AI は、企業が AI エージェントとエンドユーザー間の音声・ビデオインタラクション用アプリケーションを迅速に構築するのに役立ちます。GUI の指示に従うことで、10 分以内に専用のエージェントを構築できます。エージェントは Global Realtime Transport Network (GRTN) を介してリアルタイムでエンドユーザーと対話できます。詳細については、「概要」をご参照ください。
音声通話
| アバター通話
| ビジョン通話
|
特徴
特徴 | 説明 | シナリオ | 課金 |
ビデオ通話 | 480P から 1080P までの高画質で、1 対 1 またはグループでのビデオ通話をサポートします。 | 個人通話、会議、ビデオカスタマーサービス | |
音声通話 | 1 対 1 またはグループでの音声通話をサポートします。 | 個人通話、グループチャット、音声チャット | |
ビデオインタラクション | 480P から 1080P までの解像度、300ms 未満のエンドツーエンド遅延で、複数人でのビデオインタラクションをサポートします。 | RTS、クロスチャンネルストリーマー対戦 | |
音声インタラクション | 48 kHz のサンプリングレートで高忠実度の音声インタラクションをサポートします。 | 音声チャットルーム、オンラインカラオケ、マルチホストストリーミング | |
録画 | 音声ストリームと映像ストリームを録画し、Object Storage Service (OSS) または ApsaraVideo VOD に保存します。 | アーカイブ、コンプライアンスレビュー | |
トランスコーディング | ストリームをトランスコーディングして、品質を損なうことなく、さまざまなプラットフォームで音声・映像コンテンツをスムーズに伝送・再生できるようにします。 | 録画フォーマット変換 | |
ストリームミキシングとリレー | 特定のルールに基づいて複数のストリームを 1 つにミキシングします。ミキシングされたストリームは、ApsaraVideo Live またはサードパーティプラットフォームにリレーできます。 | マルチビューライブストリーミング、大規模な多人数会議、複数教師による共同授業 | |
音声モデレーション | Alibaba Cloud またはサードパーティが提供する音声モデレーション機能にアクセスして、音声コンテンツをレビューします。 | ビジネスセキュリティチェック、コンテンツコンプライアンス | |
映像モデレーション | Alibaba Cloud またはサードパーティが提供する映像モデレーション機能にアクセスして、映像コンテンツをレビューします。 | ビジネスセキュリティチェック、コンテンツコンプライアンス | |
顔美化 | 複数の美化エフェクトを提供します。 | ビデオ通話、インタラクティブストリーミング、オンライン授業 | |
リバーブ | ホール、教会、スタジオ、地下室、コンサートホールなど、さまざまなリバーブエフェクトをサポートします。 | 音声通話、ビデオ通話、音声チャットルーム、オンラインカラオケ。 | 無料 |
ボイスチェンジャー | エレクトリックサウンド、老人、ハスキーな男性の声、元気な女性の声など、さまざまなエフェクトをサポートします。 | オンラインカラオケルーム、音声チャットルーム | |
スマートノイズリダクション | 高忠実度の音質を維持しながら、環境ノイズを除去し、突然の大きな音を抑制し、複数のデバイスからのフィードバックをキャンセルします。 | 音声通話、多人数会議 | |
低遅延インイヤーモニター | 音声のキャプチャ、処理、再生中に、ユーザーの音声が最小限の遅延でヘッドフォン (または他のオーディオ出力デバイス) を通じてフィードバックされます。 | インタラクティブストリーミング、オンラインカラオケ、録音室 | |
オーディオ 3A 処理 | アコースティックエコーキャンセレーション (AEC)、自動ノイズ抑制 (ANS)、自動ゲインコントロール (AGC) をサポートします。 | 音声関連シナリオ | |
画面共有 | デスクトップ、ウィンドウ、または特定の画面領域を他のユーザーと共有し、カメラフィードとの同時表示をサポートします。 | オンライン授業、リモートアシスタンス | |
空間オーディオ | 高度なオーディオ技術により 3 次元空間での音の伝播をシミュレートし、方向感と位置感のある没入型オーディオ体験を創出します。 | オンラインカラオケルーム、音声チャットルーム | |
カスタム音声/映像入力 | 外部の音声および映像ストリームデータの入力をサポートします。 | カスタム美化エフェクト、カスタム効果音 |
メリット
世界中で高品質なサービス
ApsaraVideo Live は、広範なグローバルプレゼンスを誇ります:
9 つのライブセンター:中国 (北京)、中国 (深セン)、中国 (上海)、中国 (青島)、シンガポール、ドイツ (フランクフルト)、日本 (東京)、インドネシア (ジャカルタ)、サウジアラビア (リヤド) リージョン
3 つのストリームリレーハブ:中国 (上海)、シンガポール、サウジアラビア (リヤド) リージョン
世界中に 3200 以上のノード
これにより、世界中で信頼性の高い高可用性サービスが保証されます。
セキュリティコンプライアンス
ARTC は、通話に関するグローバルな規制を完全に遵守し、厳格なプライバシー保護基準に従っています。
多様なプロダクトの組み合わせ
ARTC は、ECS、OSS、セキュリティサービス、ライブストリーミング、ビデオオンデマンド、アバター、AI など、多様な Alibaba Cloud のプロダクトとサービスを活用したワンストップソリューションを提供します。
使いやすさ
シナリオベースの API 統合:ビジネスシナリオに基づいて基盤となる API 操作をカプセル化し、開発を簡素化します。詳細については、「クライアントサイド API」をご参照ください。
マルチシナリオの実践:1 対 1 の通話、共同ストリーミング、音声チャットルーム、オンラインカラオケなど、さまざまなシナリオをカバーしています。詳細については、「シナリオ別ソリューション」をご参照ください。
制限事項
チャンネルあたりのユーザー容量:
インタラクティブモード:デフォルトでは、1 つのチャンネルで最大 17 人のストリーマー (ステージ上) と 1,000 人の視聴者 (ステージ外) をサポートします。
説明インタラクティブモードで無制限の視聴者をサポートするには、ストリームを ApsaraVideo Live にリレーします。
コミュニケーションモード:デフォルトでは、1 つのチャンネルで最大 50 人のユーザーをサポートします。
各ユーザーは、同時に 1 つのメインストリーム (音声・映像、音声のみ、または映像のみ) と 1 つの画面共有ストリームのみをパブリッシュできます。
基本概念
次の表に、ARTC に関連する概念をリストします。
概念 | 説明 |
SDKAppID | 顧客サービスを管理するために、ARTC はアプリケーションの一意の識別子として SDKAppID を使用します。構成とデータを分離するために、サービスごとに独立した SDKAppID を作成する必要があります。 |
ChannelID | ChannelID によって識別されるチャンネルは、ARTC によって定義された音声・映像空間です。同じチャンネル内のユーザーは互いにやり取りできます。特定のシナリオでは、ARTC は異なるチャンネル間のユーザーの音声・映像インタラクションも許可します。 |
UserID | ARTC では、UserID はアプリケーション内のユーザーを一意に識別します。 |
Token | トークンは、悪意のある第三者がご利用のクラウドサービスリソースにアクセスするのを防ぐために Alibaba Cloud が設計したセキュリティ署名です。対応する SDK のログイン関数で、SDKAppID、UserID、ChannelID、タイムスタンプ、トークンなどの情報を提供する必要があります。 |
ストリーム | ストリームとは、ネットワーク経由での伝送のために圧縮およびエンコードされ、即座に再生できる音声・映像データの連続的な流れです。 |
パブリッシュ | パブリッシュとは、ローカルの音声・映像データを Alibaba Cloud サーバーにアップロードする操作を指します。この操作はアップストリーミングに相当します。 |
サブスクライブ | サブスクライブとは、Alibaba Cloud サーバーからローカルデバイスに音声・映像データをプルする操作を指します。この操作はストリームフェッチングに相当します。 |
ロール | ARTC には、ストリーマーと視聴者の 2 種類のロールがあります。ストリーマーは音声・映像ストリームをパブリッシュまたはサブスクライブできます。視聴者は音声・映像ストリームをサブスクライブすることしかできません。ユーザーはセッション中にロールを切り替えることができます。 |
ストリームミキシングとリレー | この機能を使用すると、複数の音声・映像ストリームをミキシングし、レイアウトとエンコーディングパラメーターを構成し、処理されたストリームを ApsaraVideo Live またはサードパーティのライブストリーミングプラットフォームにリレーできます。 ストリームを ApsaraVideo Live にリレーした後、その機能を使用してトランスコーディング、録画、ライブ視聴を行うことができます。 |
Supplemental Enhancement Information (SEI) | SEI は、H.264/AVC や H.265/HEVC などのビデオエンコーディング標準内のメカニズムです。SEI は、メタデータやその他の補助データをビデオストリームに直接埋め込みます。 |




