このトピックでは、AICallKit SDK を統合して、リアルタイム対話型 AI のソリューションを迅速にセットアップする方法について説明します。
ソリューションの概要
AICallKit SDK は、AI エージェントを管理するための開発キットです。SDK は、AI エージェントとアプリユーザー間の会話を実装するために使用できる一連の API を提供します。 AICallKit SDK を統合することにより、ほとんどの AI エージェント機能を自己開発なしで直接使用できます。これにより、開発サイクルが大幅に短縮され、アプリの品質が向上し、ユーザーにより豊かでスムーズな音声対話エクスペリエンスが提供されます。さまざまなデバイスでの統合の詳細については、以下のトピックを参照してください。
フローチャート
アプリは AppServer から RTC トークンを取得 し、call(config) メソッドを呼び出して通話を開始できます。通話中に、AICallKit API を呼び出して、AI エージェントのライブ字幕や中断などのインタラクティブ機能を実装できます。AICallKit はリアルタイムの音声およびビデオ機能に依存しているため、ApsaraVideo Real-Time Communication (ARTC) の機能は AICallKit SDK に統合されています。ビジネスシナリオでライブストリーミングと VOD 機能が必要な場合は、ApsaraVideo MediaBox SDK の使用を検討してください。詳細については、「SDK の選択とダウンロード」をご参照ください。
ソリューションのメリット
AICallKit SDK を統合すると、AI エージェントに対して一連の操作を実行できます。
ビジネス要件に基づいて独自の AppServer を開発できます。
AICallKit SDK は、Android、iOS、および Web アプリに統合できます。
機能
AI エージェント通話: 音声、デジタルヒューマン、または視覚理解エージェントとの通話を開始できます。
エージェントステータス: AI エージェントステータスをリアルタイムでクエリできます。
ライブ字幕: AI エージェントとユーザー間の会話は、リアルタイムでテキストに変換され、クライアントに表示されます。
中断: AI エージェントは、会話を中断しようとするユーザーの意図をインテリジェントに検出できます。
エージェントの高度な構成: AI エージェントの音声をカスタマイズし、音声を中断できます。
ローカルデバイス管理: 通話中にスピーカーをオフにし、マイクをミュートできます。