すべてのプロダクト
Search
ドキュメントセンター

Intelligent Media Services:開発者ガイド

最終更新日:Mar 18, 2025

このトピックでは、AI リアルタイムインタラクションの統合ソリューションを紹介し、各ソリューションの利点とシナリオについて説明します。

統合ソリューション

Alibaba Cloud は、AICallKit SDK 音声通話とビデオ通話メッセージング を基にした 2 つの統合ソリューションを、とのシナリオ向けに提供しています。

  • UI を備えた統合ソリューション: このローコードソリューションには、音声およびビデオアプリケーション用の UI コンポーネントが含まれています。簡単な構成でデモを実行し、UI コンポーネントをプロジェクトに統合できます。

  • UI を備えていない統合ソリューション: このソリューションを使用すると、ユーザーインターフェースをカスタマイズでき、AI リアルタイムインタラクションの基盤となる実装を管理する必要がありません。

説明

AICallKit SDK を基にして AI リアルタイムインタラクションを統合する場合でも、ARTC SDK が提供する API にアクセスできます。 AICallKit SDK は、特定のシナリオ向けに ARTC SDK の特定の機能をカプセル化した、信頼性の高い特殊なインターフェースです。このソリューションは、統合プロセスを簡素化し、柔軟性を提供します。

サーバー側の機能

  • エージェント構成: ウェルカムメッセージと音声をカスタマイズし、インテリジェントな割り込みを有効にできます。

  • 通話記録: 組み込みの音声認識技術により、通話の内容が自動的に書き起こされます。コンテンツを確認し、モデルのトレーニングに記録を使用できます。

  • コールバック: 特定のイベントが発生したときに自動操作または応答をトリガーするように、AI エージェントのコールバックを構成できます。

  • ホットワード認識: ホットワードをアップロードして、特定の用語やフレーズを正確に認識できるようにすることができます。 

  • アバター統合: アバターが統合されると、ワークフローの音声応答をアバターで表現できるようになり、より豊かで直感的なインタラクティブエクスペリエンスが提供されます。