すべてのプロダクト
Search
ドキュメントセンター

ApsaraVideo Live:ARTC の概要

最終更新日:Dec 16, 2025

従来のライブストリーミングは一方向のコンテンツ配信に重点を置いているため、視聴者のエンゲージメントやコンバージョン率が低いという課題がありました。ApsaraVideo Real-time Communication (ARTC) は、音声チャット、映像共同ストリーミング、ゲームインタラクションなどのインタラクティブ機能を通じて、受動的な視聴者を能動的な参加者へと変えます。

アーキテクチャ

ARTC は、高度な技術アーキテクチャとアルゴリズムに基づき、開発者や企業に効率的で安定した、使いやすい SDK と API を提供します。iOS、Android、Web、Windows などのプラットフォーム間でシームレスな統合をサポートします。さらに、ARTC を他の Alibaba Cloud サービスと組み合わせることで、より幅広いユースケースに対応するソリューションを構築できます。

ユースケース

音声チャット

最大 50 人の同時発話をサポートし、エンドツーエンドの遅延は 150~400 ms です。ボイスチェンジャー、リバーブ、音声強調など、さまざまな音声機能を利用できます。コンテンツコンプライアンスのために、ARTC はコンテンツモデレーションサービスを提供し、サードパーティ連携もサポートしています。シナリオベースのソリューションについては、「音声チャットルーム」、「オンラインカラオケ」、「1 対 1 の音声・ビデオ通話」をご参照ください。

共同ストリーミング

ARTC は共同ライブストリーミングをサポートしており、視聴者はライブコンテンツと並行してストリーマーとチャットしたり、異なるルームのストリーマーが人気ベースの対戦を行ったりできます。エンドツーエンドの遅延は 150~400 ms で、視聴者はライブストリームにシームレスに参加・退出できます。さらに、標準ストリーミングとリアルタイムストリーミング (RTS) の両方をサポートし、10 万人以上の同時視聴者数を実現します。詳細については、「マルチホストストリーミング」をご参照ください。

共同ストリーミング

image

ストリーマー対戦

image

リアルタイム対話型 AI

リアルタイム対話型 AI は、企業が AI エージェントとエンドユーザー間の音声・ビデオインタラクション用アプリケーションを迅速に構築するのに役立ちます。GUI の指示に従うことで、10 分以内に専用のエージェントを構築できます。エージェントは Global Realtime Transport Network (GRTN) を介してリアルタイムでエンドユーザーと対話できます。詳細については、「概要」をご参照ください。

音声通話

lQDPJxfI6jx3dVXNC6zNBaCwBmqQRhnIAYIHiTmemZYXAA_1440_2988

アバター通話

lQDPJwMuwU90JFXNC6zNBaCwNbn8uKeIjbgHiTmd5-WQAA_1440_2988

ビジョン通話

lQDPJwpRBT4ppFXNC6zNBaCwzODP1_m-L7MHiTmc7Nh_AA_1440_2988

特徴

特徴

説明

シナリオ

課金

ビデオ通話

480P から 1080P までの高画質で、1 対 1 またはグループでのビデオ通話をサポートします。

個人通話、会議、ビデオカスタマーサービス

音声/ビデオ通信の課金

音声通話

1 対 1 またはグループでの音声通話をサポートします。

個人通話、グループチャット、音声チャット

ビデオインタラクション

480P から 1080P までの解像度、300ms 未満のエンドツーエンド遅延で、複数人でのビデオインタラクションをサポートします。

RTS、クロスチャンネルストリーマー対戦

音声インタラクション

48 kHz のサンプリングレートで高忠実度の音声インタラクションをサポートします。

音声チャットルーム、オンラインカラオケ、マルチホストストリーミング

録画

音声ストリームと映像ストリームを録画し、Object Storage Service (OSS) または ApsaraVideo VOD に保存します。

アーカイブ、コンプライアンスレビュー

ライブ録画の課金

トランスコーディング

ストリームをトランスコーディングして、品質を損なうことなく、さまざまなプラットフォームで音声・映像コンテンツをスムーズに伝送・再生できるようにします。

録画フォーマット変換

ライブトランスコーディングの課金

ストリームミキシングとリレー

特定のルールに基づいて複数のストリームを 1 つにミキシングします。ミキシングされたストリームは、ApsaraVideo Live またはサードパーティプラットフォームにリレーできます。

マルチビューライブストリーミング、大規模な多人数会議、複数教師による共同授業

ストリームリレーの課金

音声モデレーション

Alibaba Cloud またはサードパーティが提供する音声モデレーション機能にアクセスして、音声コンテンツをレビューします。

ビジネスセキュリティチェック、コンテンツコンプライアンス

自動レビューの課金

映像モデレーション

Alibaba Cloud またはサードパーティが提供する映像モデレーション機能にアクセスして、映像コンテンツをレビューします。

ビジネスセキュリティチェック、コンテンツコンプライアンス

顔美化

複数の美化エフェクトを提供します。

ビデオ通話、インタラクティブストリーミング、オンライン授業

Queen SDK の課金

リバーブ

ホール、教会、スタジオ、地下室、コンサートホールなど、さまざまなリバーブエフェクトをサポートします。

音声通話、ビデオ通話、音声チャットルーム、オンラインカラオケ。

無料

ボイスチェンジャー

エレクトリックサウンド、老人、ハスキーな男性の声、元気な女性の声など、さまざまなエフェクトをサポートします。

オンラインカラオケルーム、音声チャットルーム

スマートノイズリダクション

高忠実度の音質を維持しながら、環境ノイズを除去し、突然の大きな音を抑制し、複数のデバイスからのフィードバックをキャンセルします。

音声通話、多人数会議

低遅延インイヤーモニター

音声のキャプチャ、処理、再生中に、ユーザーの音声が最小限の遅延でヘッドフォン (または他のオーディオ出力デバイス) を通じてフィードバックされます。

インタラクティブストリーミング、オンラインカラオケ、録音室

オーディオ 3A 処理

アコースティックエコーキャンセレーション (AEC)、自動ノイズ抑制 (ANS)、自動ゲインコントロール (AGC) をサポートします。

音声関連シナリオ

画面共有

デスクトップ、ウィンドウ、または特定の画面領域を他のユーザーと共有し、カメラフィードとの同時表示をサポートします。

オンライン授業、リモートアシスタンス

空間オーディオ

高度なオーディオ技術により 3 次元空間での音の伝播をシミュレートし、方向感と位置感のある没入型オーディオ体験を創出します。

オンラインカラオケルーム、音声チャットルーム

カスタム音声/映像入力

外部の音声および映像ストリームデータの入力をサポートします。

カスタム美化エフェクト、カスタム効果音

メリット

世界中で高品質なサービス

ApsaraVideo Live は、広範なグローバルプレゼンスを誇ります:

  • 9 つのライブセンター:中国 (北京)、中国 (深セン)、中国 (上海)、中国 (青島)、シンガポール、ドイツ (フランクフルト)、日本 (東京)、インドネシア (ジャカルタ)、サウジアラビア (リヤド) リージョン

  • 3 つのストリームリレーハブ:中国 (上海)、シンガポール、サウジアラビア (リヤド) リージョン

  • 世界中に 3200 以上のノード

これにより、世界中で信頼性の高い高可用性サービスが保証されます。

セキュリティコンプライアンス

ARTC は、通話に関するグローバルな規制を完全に遵守し、厳格なプライバシー保護基準に従っています。

多様なプロダクトの組み合わせ

ARTC は、ECS、OSS、セキュリティサービス、ライブストリーミング、ビデオオンデマンド、アバター、AI など、多様な Alibaba Cloud のプロダクトとサービスを活用したワンストップソリューションを提供します。

使いやすさ

  • シナリオベースの API 統合:ビジネスシナリオに基づいて基盤となる API 操作をカプセル化し、開発を簡素化します。詳細については、「クライアントサイド API」をご参照ください。

  • マルチシナリオの実践:1 対 1 の通話、共同ストリーミング、音声チャットルーム、オンラインカラオケなど、さまざまなシナリオをカバーしています。詳細については、「シナリオ別ソリューション」をご参照ください。

制限事項

  • チャンネルあたりのユーザー容量:

    • インタラクティブモード:デフォルトでは、1 つのチャンネルで最大 17 人のストリーマー (ステージ上) と 1,000 人の視聴者 (ステージ外) をサポートします。

      説明

      インタラクティブモードで無制限の視聴者をサポートするには、ストリームを ApsaraVideo Live にリレーします。

    • コミュニケーションモード:デフォルトでは、1 つのチャンネルで最大 50 人のユーザーをサポートします。

  • 各ユーザーは、同時に 1 つのメインストリーム (音声・映像、音声のみ、または映像のみ) と 1 つの画面共有ストリームのみをパブリッシュできます。

基本概念

次の表に、ARTC に関連する概念をリストします。

概念

説明

SDKAppID

顧客サービスを管理するために、ARTC はアプリケーションの一意の識別子として SDKAppID を使用します。構成とデータを分離するために、サービスごとに独立した SDKAppID を作成する必要があります。

ChannelID

ChannelID によって識別されるチャンネルは、ARTC によって定義された音声・映像空間です。同じチャンネル内のユーザーは互いにやり取りできます。特定のシナリオでは、ARTC は異なるチャンネル間のユーザーの音声・映像インタラクションも許可します。

UserID

ARTC では、UserID はアプリケーション内のユーザーを一意に識別します。

Token

トークンは、悪意のある第三者がご利用のクラウドサービスリソースにアクセスするのを防ぐために Alibaba Cloud が設計したセキュリティ署名です。対応する SDK のログイン関数で、SDKAppIDUserIDChannelIDタイムスタンプトークンなどの情報を提供する必要があります。

ストリーム

ストリームとは、ネットワーク経由での伝送のために圧縮およびエンコードされ、即座に再生できる音声・映像データの連続的な流れです。

パブリッシュ

パブリッシュとは、ローカルの音声・映像データを Alibaba Cloud サーバーにアップロードする操作を指します。この操作はアップストリーミングに相当します。

サブスクライブ

サブスクライブとは、Alibaba Cloud サーバーからローカルデバイスに音声・映像データをプルする操作を指します。この操作はストリームフェッチングに相当します。

ロール

ARTC には、ストリーマー視聴者の 2 種類のロールがあります。ストリーマーは音声・映像ストリームをパブリッシュまたはサブスクライブできます。視聴者は音声・映像ストリームをサブスクライブすることしかできません。ユーザーはセッション中にロールを切り替えることができます。

ストリームミキシングとリレー

この機能を使用すると、複数の音声・映像ストリームをミキシングし、レイアウトとエンコーディングパラメーターを構成し、処理されたストリームを ApsaraVideo Live またはサードパーティのライブストリーミングプラットフォームにリレーできます。

ストリームを ApsaraVideo Live にリレーした後、その機能を使用してトランスコーディング、録画、ライブ視聴を行うことができます。

Supplemental Enhancement Information (SEI)

SEI は、H.264/AVC や H.265/HEVC などのビデオエンコーディング標準内のメカニズムです。SEI は、メタデータやその他の補助データをビデオストリームに直接埋め込みます。