Topik ini menjelaskan cara membuat agen pesan interaktif secara cepat.
Sebelum menggunakan AI Percakapan Real-time, pastikan persyaratan berikut terpenuhi:
Langganan Intelligent Media Services (IMS) telah ditingkatkan ke IMS Enterprise Standard Edition atau Ultimate Edition. Untuk meningkatkan layanan yang telah dilanggankan, kunjungi halaman Langganan IMS.
Fitur AI Percakapan Real-time telah diaktifkan. Untuk mengaktifkan fitur tersebut, kunjungi halaman pembelian.
Langkah 1: Buat alur kerja pesan interaktif
Masuk ke Konsol Intelligent Media Services dan klik Create Workflow Template.
Pilih tipe alur kerja Interactive Messaging dan konfigurasikan informasi node sesuai kebutuhan.
CatatanUntuk menggunakan fitur pengenalan ucapan atau teks-ke-ucapan, Anda harus mengonfigurasi node berikut:
Konfigurasikan node STT Speech-to-Text untuk mengaktifkan pengenalan ucapan.
Konfigurasikan node TTS Text-to-Speech untuk mengaktifkan pemutaran teks-ke-ucapan.

STT Speech-to-Text
Node ini mengubah input ucapan menjadi teks dan mendukung berbagai bahasa.

System Preset: Model preset sistem memungkinkan Anda memilih model bahasa, menetapkan durasi diam, dan mengonfigurasi hotword kustom.
Model bahasa: Anda dapat memilih model bahasa yang berbeda berdasarkan skenario bisnis Anda.
Durasi diam: Lama waktu agen menunggu ketika tidak ada input suara dari pengguna.
Hotword kustom: Konfigurasikan hotword untuk meningkatkan akurasi pengenalan kosakata spesifik domain. Untuk informasi selengkapnya, lihat Hotword Pengenalan Ucapan.
Third-party plugin: Saat ini, Anda dapat memilih iFLYTEK Speech Recognition. Untuk mendapatkan parameter yang diperlukan, kunjungi iFLYTEK Real-time Speech-to-Text.
TTS Text-to-Speech
Node ini mengubah teks yang telah diproses kembali menjadi ucapan sehingga pengguna dapat mendengar tanggapan sistem.

Anda dapat memilih model teks-ke-ucapan (TTS) untuk skenario Anda, seperti berikut: Preset Template, Custom Template, dan Third-party Plug-in.
Preset Template: Saat memilih preset template, konfigurasikan suaranya. Untuk contoh berbagai efek suara cerdas, lihat Contoh Efek Suara Cerdas.
Custom Template: Tambahkan model besar kustom Anda ke alur kerja menggunakan protokol standar. Untuk informasi selengkapnya, lihat Standard TTS API.
Third-party Plug-in: Saat ini, hanya MiniMax Voice Model yang didukung. Beberapa versi tersedia. Gunakan versi terbaru. Untuk informasi selengkapnya, lihat MiniMax Voice Model.
LLM Large Language Model
Node Large Language Model (LLM) menggunakan model bahasa besar yang telah dipre-train untuk memahami dan menghasilkan teks bahasa alami berdasarkan input teks dari node Speech-to-Text (STT).

AI Percakapan Real-time saat ini mendukung koneksi ke Qwen (preset sistem), Alibaba Cloud Model Studio, Alibaba Tongyi Xingchen, dan model buatan sendiri (kompatibel OpenAI).
Alibaba Cloud Model Studio
Alibaba Cloud Model Studio adalah platform satu atap untuk mengembangkan model besar dan membangun aplikasi. Anda dapat menyambungkan ke model bahasa dan layanan dari Model Hub atau App Center.
Model Hub: Di Model Square Alibaba Cloud Model Studio, pilih model yang sesuai dengan kebutuhan Anda dan klik View Details untuk mendapatkan ModelId. Klik API KEY untuk mendapatkan API-KEY.
Application Center: Anda harus terlebih dahulu membuat aplikasi agen di Alibaba Cloud Model Studio. Setelah aplikasi dibuat, dapatkan AppId.
Klik Invoke untuk membuka antarmuka aplikasi agen. Di pojok kanan atas, klik API KEY untuk mendapatkan API-KEY.
Alibaba Tongyi Xingchen
Alibaba Tongyi Xingchen memungkinkan Anda membuat agen yang sangat personal dengan kepribadian dan gaya unik. Ketika dikombinasikan dengan kemampuan suara interaktif real-time dari manusia digital, agen-agen ini dapat melakukan interaksi kaya di berbagai skenario.
ModelId: Alibaba Tongyi Xingchen saat ini menawarkan lima model berikut:
xingchen-lite,xingchen-base,xingchen-plus,xingchen-plus-v2, danxingchen-max.API-KEY: Kunjungi Konsol Xingchen untuk membuat dan mendapatkan API KEY.
Self-developed (OpenAI-compliant)
AI Percakapan Real-time juga mendukung koneksi ke model besar buatan sendiri yang mematuhi standar OpenAI.
Standar OpenAI: Jika Anda memilih untuk menyambung sesuai standar OpenAI, Anda perlu memasukkan parameter berikut:
Nama
Deskripsi
Contoh
ModelId
Bidang model standar OpenAI, yang menunjukkan nama model.
abc
API-KEY
Bidang api_key standar OpenAI, yang menunjukkan informasi autentikasi API.
AUJH-pfnTNMPBm6iWXcJAcWsrscb5KYaLitQhHBLKrI
Target model HTTPS address
Bidang base_url standar OpenAI, yang menunjukkan alamat permintaan layanan target.
http://www.abc.com
Untuk informasi selengkapnya tentang integrasi LLM buatan sendiri, lihat Antarmuka Standar LLM.
Klik Save untuk menyelesaikan pembuatan alur kerja pesan interaktif.
Langkah 2: Buat agen pesan interaktif
Masuk ke Konsol Intelligent Media Services dan klik Create Agent.
Konfigurasikan informasi dasar dan sambungkan alur kerja pesan interaktif.

Buat aplikasi Interactive Messages.
CatatanPesan interaktif bergantung pada aplikasi Interactive Messages. Aplikasi ini bertindak sebagai jembatan komunikasi untuk memastikan fitur pesan berfungsi dengan benar.


Konfigurasikan aplikasi Interactive Messages dan klik Submit untuk menyelesaikan pembuatan agen pesan interaktif.
Langkah 3: Coba agen tersebut
Setelah agen percakapan dibuat, Anda dapat memindai kode QR uji coba untuk mencobanya.
Di konsol, hasilkan kode QR uji coba demo.

Gunakan DingTalk, WeChat, atau browser untuk memindai kode QR tersebut. Anda juga dapat menyalin URL uji coba ke browser untuk merasakan demo H5.

Integrasikan agen pesan interaktif
Anda harus mendapatkan parameter berikut sebelum memulai integrasi. Untuk informasi selengkapnya tentang mengintegrasikan agen pesan interaktif ke dalam proyek Anda, lihat Integrasikan agen pesan interaktif.
ID Wilayah: Wilayah tempat alur kerja dan agen berada di Konsol Intelligent Media Services.

Nama Wilayah
ID Wilayah
China (Hangzhou)
cn-hangzhou
China (Shanghai)
cn-shanghai
China (Beijing)
cn-beijing
China (Shenzhen)
cn-shenzhen
Singapura
ap-southeast-1
AppId dan AppKey dari aplikasi Interactive Messages:


AccessKey ID dan AccessKey secret: Untuk informasi selengkapnya, lihat Buat AccessKey.