全部产品
Search
文档中心

Intelligent Media Services:Mulai Cepat untuk Pesan Interaktif

更新时间:Nov 11, 2025

Topik ini menjelaskan cara membuat agen pesan interaktif secara cepat.

Sebelum menggunakan AI Percakapan Real-time, pastikan persyaratan berikut terpenuhi:

  • Langganan Intelligent Media Services (IMS) telah ditingkatkan ke IMS Enterprise Standard Edition atau Ultimate Edition. Untuk meningkatkan layanan yang telah dilanggankan, kunjungi halaman Langganan IMS.

  • Fitur AI Percakapan Real-time telah diaktifkan. Untuk mengaktifkan fitur tersebut, kunjungi halaman pembelian.

Langkah 1: Buat alur kerja pesan interaktif

  1. Masuk ke Konsol Intelligent Media Services dan klik Create Workflow Template.

  2. Pilih tipe alur kerja Interactive Messaging dan konfigurasikan informasi node sesuai kebutuhan.

    Catatan

    Untuk menggunakan fitur pengenalan ucapan atau teks-ke-ucapan, Anda harus mengonfigurasi node berikut:

    • Konfigurasikan node STT Speech-to-Text untuk mengaktifkan pengenalan ucapan.

    • Konfigurasikan node TTS Text-to-Speech untuk mengaktifkan pemutaran teks-ke-ucapan.

    image

    STT Speech-to-Text

    Node ini mengubah input ucapan menjadi teks dan mendukung berbagai bahasa.

    image

    • System Preset: Model preset sistem memungkinkan Anda memilih model bahasa, menetapkan durasi diam, dan mengonfigurasi hotword kustom.

      • Model bahasa: Anda dapat memilih model bahasa yang berbeda berdasarkan skenario bisnis Anda.

      • Durasi diam: Lama waktu agen menunggu ketika tidak ada input suara dari pengguna.

      • Hotword kustom: Konfigurasikan hotword untuk meningkatkan akurasi pengenalan kosakata spesifik domain. Untuk informasi selengkapnya, lihat Hotword Pengenalan Ucapan.

    • Third-party plugin: Saat ini, Anda dapat memilih iFLYTEK Speech Recognition. Untuk mendapatkan parameter yang diperlukan, kunjungi iFLYTEK Real-time Speech-to-Text.

    TTS Text-to-Speech

    Node ini mengubah teks yang telah diproses kembali menjadi ucapan sehingga pengguna dapat mendengar tanggapan sistem.

    image

    Anda dapat memilih model teks-ke-ucapan (TTS) untuk skenario Anda, seperti berikut: Preset Template, Custom Template, dan Third-party Plug-in.

    • Preset Template: Saat memilih preset template, konfigurasikan suaranya. Untuk contoh berbagai efek suara cerdas, lihat Contoh Efek Suara Cerdas.

    • Custom Template: Tambahkan model besar kustom Anda ke alur kerja menggunakan protokol standar. Untuk informasi selengkapnya, lihat Standard TTS API.

    • Third-party Plug-in: Saat ini, hanya MiniMax Voice Model yang didukung. Beberapa versi tersedia. Gunakan versi terbaru. Untuk informasi selengkapnya, lihat MiniMax Voice Model.

    LLM Large Language Model

    Node Large Language Model (LLM) menggunakan model bahasa besar yang telah dipre-train untuk memahami dan menghasilkan teks bahasa alami berdasarkan input teks dari node Speech-to-Text (STT).

    image

    AI Percakapan Real-time saat ini mendukung koneksi ke Qwen (preset sistem), Alibaba Cloud Model Studio, Alibaba Tongyi Xingchen, dan model buatan sendiri (kompatibel OpenAI).

    Alibaba Cloud Model Studio

    Alibaba Cloud Model Studio adalah platform satu atap untuk mengembangkan model besar dan membangun aplikasi. Anda dapat menyambungkan ke model bahasa dan layanan dari Model Hub atau App Center.

    • Model Hub: Di Model Square Alibaba Cloud Model Studio, pilih model yang sesuai dengan kebutuhan Anda dan klik View Details untuk mendapatkan ModelId. Klik API KEY untuk mendapatkan API-KEY.

    • Application Center: Anda harus terlebih dahulu membuat aplikasi agen di Alibaba Cloud Model Studio. Setelah aplikasi dibuat, dapatkan AppId.

      Klik Invoke untuk membuka antarmuka aplikasi agen. Di pojok kanan atas, klik API KEY untuk mendapatkan API-KEY.

    Alibaba Tongyi Xingchen

    Alibaba Tongyi Xingchen memungkinkan Anda membuat agen yang sangat personal dengan kepribadian dan gaya unik. Ketika dikombinasikan dengan kemampuan suara interaktif real-time dari manusia digital, agen-agen ini dapat melakukan interaksi kaya di berbagai skenario.

    • ModelId: Alibaba Tongyi Xingchen saat ini menawarkan lima model berikut: xingchen-lite, xingchen-base, xingchen-plus, xingchen-plus-v2, dan xingchen-max.

    • API-KEY: Kunjungi Konsol Xingchen untuk membuat dan mendapatkan API KEY.

    Self-developed (OpenAI-compliant)

    AI Percakapan Real-time juga mendukung koneksi ke model besar buatan sendiri yang mematuhi standar OpenAI.

    Standar OpenAI: Jika Anda memilih untuk menyambung sesuai standar OpenAI, Anda perlu memasukkan parameter berikut:

    Nama

    Deskripsi

    Contoh

    ModelId

    Bidang model standar OpenAI, yang menunjukkan nama model.

    abc

    API-KEY

    Bidang api_key standar OpenAI, yang menunjukkan informasi autentikasi API.

    AUJH-pfnTNMPBm6iWXcJAcWsrscb5KYaLitQhHBLKrI

    Target model HTTPS address

    Bidang base_url standar OpenAI, yang menunjukkan alamat permintaan layanan target.

    http://www.abc.com

    Untuk informasi selengkapnya tentang integrasi LLM buatan sendiri, lihat Antarmuka Standar LLM.

  3. Klik Save untuk menyelesaikan pembuatan alur kerja pesan interaktif.

Langkah 2: Buat agen pesan interaktif

  1. Masuk ke Konsol Intelligent Media Services dan klik Create Agent.

  2. Konfigurasikan informasi dasar dan sambungkan alur kerja pesan interaktif.

    image

  3. Buat aplikasi Interactive Messages.

    Catatan

    Pesan interaktif bergantung pada aplikasi Interactive Messages. Aplikasi ini bertindak sebagai jembatan komunikasi untuk memastikan fitur pesan berfungsi dengan benar.

    image

    image

  4. Konfigurasikan aplikasi Interactive Messages dan klik Submit untuk menyelesaikan pembuatan agen pesan interaktif.

Langkah 3: Coba agen tersebut

Setelah agen percakapan dibuat, Anda dapat memindai kode QR uji coba untuk mencobanya.

  1. Di konsol, hasilkan kode QR uji coba demo.

    image

  2. Gunakan DingTalk, WeChat, atau browser untuk memindai kode QR tersebut. Anda juga dapat menyalin URL uji coba ke browser untuk merasakan demo H5.

    image

Integrasikan agen pesan interaktif

Anda harus mendapatkan parameter berikut sebelum memulai integrasi. Untuk informasi selengkapnya tentang mengintegrasikan agen pesan interaktif ke dalam proyek Anda, lihat Integrasikan agen pesan interaktif.

  • ID Wilayah: Wilayah tempat alur kerja dan agen berada di Konsol Intelligent Media Services.

    image

    Nama Wilayah

    ID Wilayah

    China (Hangzhou)

    cn-hangzhou

    China (Shanghai)

    cn-shanghai

    China (Beijing)

    cn-beijing

    China (Shenzhen)

    cn-shenzhen

    Singapura

    ap-southeast-1

  • AppId dan AppKey dari aplikasi Interactive Messages:

    image

    image

  • AccessKey ID dan AccessKey secret: Untuk informasi selengkapnya, lihat Buat AccessKey.