All Products
Search
Document Center

Alibaba Cloud Model Studio:Sintesis suara

Last Updated:Apr 27, 2026

Pilih model yang sesuai untuk sintesis suara, kloning suara, dan desain suara.

Halaman ini mencantumkan model untuk sintesis suara dan layanan suara, termasuk versi sebelumnya. Jawab dua pertanyaan berikut untuk mempersempit pilihan Anda:

  1. Apakah Anda memerlukan suara kustom, atau apakah suara bawaan sudah mencukupi?

  2. Apakah Anda memerlukan keluaran streaming real-time, atau apakah non-streaming dapat diterima?

Sintesis suara standar atau suara kustom?

Sintesis suara standar

Gunakan suara bawaan tanpa konfigurasi tambahan. Pilih model dan suara untuk memulai sintesis.

Internasional

Model

Series

Keunggulan utama

cosyvoice-v3-plus

CosyVoice

Kualitas tinggi, dengan pustaka suara yang kaya

cosyvoice-v3-flash

CosyVoice

Sintesis cepat

qwen3-tts-flash

Qwen3-TTS

Latensi rendah, kualitas tinggi

qwen3-tts-flash-2025-11-27

Qwen3-TTS

Latensi rendah, kualitas tinggi (versi Snapshot)

qwen3-tts-flash-2025-09-18

Qwen3-TTS

Latensi rendah, kualitas tinggi (versi Snapshot)

qwen3-tts-flash-realtime

Qwen3-TTS

Keluaran streaming Real-time, latensi rendah

qwen3-tts-flash-realtime-2025-11-27

Qwen3-TTS

Keluaran streaming Real-time, latensi rendah (versi Snapshot)

qwen3-tts-flash-realtime-2025-09-18

Qwen3-TTS

Keluaran streaming Real-time, latensi rendah (versi Snapshot)

qwen3-tts-instruct-flash

Qwen3-TTS

Kontrol instruksi (laju bicara, emosi, dan gaya)

qwen3-tts-instruct-flash-2026-01-26

Qwen3-TTS

Kontrol instruksi (laju bicara, emosi, dan gaya) (versi Snapshot)

qwen3-tts-instruct-flash-realtime

Qwen3-TTS

Keluaran streaming Real-time dan kontrol instruksi (laju bicara, emosi, dan gaya)

qwen3-tts-instruct-flash-realtime-2026-01-22

Qwen3-TTS

Keluaran streaming Real-time dan kontrol instruksi (laju bicara, emosi, dan gaya) (versi Snapshot)

China daratan

Model

Series

Keunggulan utama

cosyvoice-v3.5-plus

CosyVoice

Kualitas tinggi, dengan pustaka suara yang terus diperbarui

cosyvoice-v3.5-flash

CosyVoice

Sintesis cepat

cosyvoice-v3-plus

CosyVoice

Kualitas tinggi, dengan pustaka suara yang kaya

cosyvoice-v3-flash

CosyVoice

Sintesis cepat

cosyvoice-v2

CosyVoice

Sintesis berkualitas tinggi versi lama

cosyvoice-v1

CosyVoice

Sintesis dasar versi lama

qwen3-tts-flash

Qwen3-TTS

Latensi rendah, kualitas tinggi

qwen3-tts-flash-2025-11-27

Qwen3-TTS

Latensi rendah, kualitas tinggi (versi Snapshot)

qwen3-tts-flash-2025-09-18

Qwen3-TTS

Latensi rendah, kualitas tinggi (versi Snapshot)

qwen3-tts-flash-realtime

Qwen3-TTS

Keluaran streaming Real-time, latensi rendah

qwen3-tts-flash-realtime-2025-11-27

Qwen3-TTS

Keluaran streaming Real-time, latensi rendah (versi Snapshot)

qwen3-tts-flash-realtime-2025-09-18

Qwen3-TTS

Keluaran streaming Real-time, latensi rendah (versi Snapshot)

qwen3-tts-instruct-flash

Qwen3-TTS

Kontrol instruksi (laju bicara, emosi, dan gaya)

qwen3-tts-instruct-flash-2026-01-26

Qwen3-TTS

Kontrol instruksi (laju bicara, emosi, dan gaya) (versi Snapshot)

qwen3-tts-instruct-flash-realtime

Qwen3-TTS

Keluaran streaming Real-time dan kontrol instruksi (laju bicara, emosi, dan gaya)

qwen3-tts-instruct-flash-realtime-2026-01-22

Qwen3-TTS

Keluaran streaming Real-time dan kontrol instruksi (laju bicara, emosi, dan gaya) (versi Snapshot)

MiniMax/speech-2.8-hd

MiniMax

Sintesis suara beresolusi tinggi

MiniMax/speech-02-hd

MiniMax

Sintesis suara fidelitas tinggi

MiniMax/speech-2.8-turbo

MiniMax

Sintesis cepat dengan latensi rendah

MiniMax/speech-02-turbo

MiniMax

Sintesis cepat dengan latensi rendah

Suara kustom

Buat suara unik dari sampel audio atau deskripsi teks.

Internasional

Model

Series

Keunggulan utama

qwen3-tts-vc-2026-01-22

Qwen3-TTS

Kloning suara dari sampel audio

qwen3-tts-vc-realtime-2026-01-15

Qwen3-TTS

Kloning suara Real-time

qwen3-tts-vc-realtime-2025-11-27

Qwen3-TTS

Kloning suara Real-time

qwen3-tts-vd-2026-01-26

Qwen3-TTS

Desain suara dari deskripsi teks

qwen3-tts-vd-realtime-2026-01-15

Qwen3-TTS

Desain suara Real-time

qwen3-tts-vd-realtime-2025-12-16

Qwen3-TTS

Desain suara Real-time

qwen-voice-enrollment

Qwen Voice Cloning

Kloning suara (pendaftaran dan management suara)

qwen-voice-design

Qwen Voice Design

Desain suara (membuat suara dari teks)

Catatan

Kloning suara vs. desain suara: Kloning suara menduplikasi suara tertentu dari sampel audio. Desain suara membuat suara baru berdasarkan deskripsi teks, seperti "suara perempuan hangat dengan nada rendah". Gunakan kloning suara jika Anda memiliki suara target. Gunakan desain suara jika Anda ingin membuat suara dari awal.

Kontrol ekspresi suara

Tersedia tiga opsi, diurutkan berdasarkan tingkat fleksibilitas:

  1. Kontrol instruksi (qwen3-tts-instruct-flash, qwen3-tts-instruct-flash-realtime): Gunakan bahasa alami untuk menggambarkan gaya ekspresi yang diinginkan serta mengontrol laju bicara, emosi, dan gaya sesuai permintaan.

  2. Desain suara (qwen3-tts-vd-*): Membuat suara kustom dari deskripsi teks. Ideal untuk menciptakan suara merek tanpa sampel audio.

  3. Kloning suara (qwen3-tts-vc-*): Menyalin suara yang ada dari sampel audio. Cocok untuk mereplikasi suara orang tertentu.

Perbandingan lengkap

Model

Series

Streaming

Suara kustom

Kontrol instruksi

cosyvoice-v3.5-plus

CosyVoice

Didukung

Tidak didukung

Tidak didukung

cosyvoice-v3.5-flash

CosyVoice

Didukung

Tidak didukung

Tidak didukung

cosyvoice-v3-plus

CosyVoice

Didukung

Tidak didukung

Tidak didukung

cosyvoice-v3-flash

CosyVoice

Didukung

Tidak didukung

Tidak didukung

cosyvoice-v2

CosyVoice

Didukung

Tidak didukung

Tidak didukung

qwen3-tts-flash

Qwen3-TTS

Didukung

Tidak didukung

Tidak didukung

qwen3-tts-flash-2025-11-27

Qwen3-TTS

Didukung

Tidak didukung

Tidak didukung

qwen3-tts-flash-2025-09-18

Qwen3-TTS

Didukung

Tidak didukung

Tidak didukung

qwen3-tts-flash-realtime

Qwen3-TTS

Didukung

Tidak didukung

Tidak didukung

qwen3-tts-flash-realtime-2025-11-27

Qwen3-TTS

Didukung

Tidak didukung

Tidak didukung

qwen3-tts-flash-realtime-2025-09-18

Qwen3-TTS

Didukung

Tidak didukung

Tidak didukung

qwen3-tts-instruct-flash

Qwen3-TTS

Didukung

Tidak didukung

Didukung

qwen3-tts-instruct-flash-2026-01-26

Qwen3-TTS

Didukung

Tidak didukung

Didukung

qwen3-tts-instruct-flash-realtime

Qwen3-TTS

Didukung

Tidak didukung

Didukung

qwen3-tts-instruct-flash-realtime-2026-01-22

Qwen3-TTS

Didukung

Tidak didukung

Didukung

qwen3-tts-vc-2026-01-22

Voice cloning

Tidak didukung

Didukung

Tidak didukung

qwen3-tts-vc-realtime-2026-01-15

Voice cloning

Didukung

Didukung

Tidak didukung

qwen3-tts-vc-realtime-2025-11-27

Voice cloning

Didukung

Didukung

Tidak didukung

qwen3-tts-vd-2026-01-26

Voice design

Tidak didukung

Didukung

Tidak didukung

qwen3-tts-vd-realtime-2026-01-15

Voice design

Didukung

Didukung

Tidak didukung

qwen3-tts-vd-realtime-2025-12-16

Voice design

Didukung

Didukung

Tidak didukung

qwen-tts

Qwen-TTS (Legacy)

Tidak didukung (generasi seluruh teks)

Tidak didukung

Tidak didukung

qwen-tts-latest

Qwen-TTS (Legacy)

Tidak didukung (generasi seluruh teks)

Tidak didukung

Tidak didukung

qwen-tts-2025-05-22

Qwen-TTS (Legacy)

Tidak didukung (generasi seluruh teks)

Tidak didukung

Tidak didukung

qwen-tts-2025-04-10

Qwen-TTS (Legacy)

Tidak didukung (generasi seluruh teks)

Tidak didukung

Tidak didukung

qwen-tts-realtime

Qwen-TTS (Legacy)

Didukung

Tidak didukung

Tidak didukung

qwen-tts-realtime-latest

Qwen-TTS (Legacy)

Didukung

Tidak didukung

Tidak didukung

qwen-tts-realtime-2025-07-15

Qwen-TTS (Legacy)

Didukung

Tidak didukung

Tidak didukung

qwen-voice-enrollment

Voice service

N/A

Didukung (pendaftaran suara)

Tidak didukung

qwen-voice-design

Voice service

N/A

Didukung (desain suara)

Tidak didukung

Model lama (Qwen-TTS, penagihan berbasis token)

Model Qwen-TTS lama menggunakan penagihan berbasis token dan dapat diakses melalui HTTP atau WebSocket. Jika Anda telah bermigrasi ke Qwen3-TTS, gunakan model sintesis suara standar di atas.

Internasional

Model

Metode akses

Deskripsi

qwen-tts

HTTP

Sintesis non-streaming, penagihan berbasis token

qwen-tts-latest

HTTP

Sintesis non-streaming, penagihan berbasis token

qwen-tts-2025-05-22

HTTP

Versi Snapshot, penagihan berbasis token

qwen-tts-2025-04-10

HTTP

Versi Snapshot, penagihan berbasis token

qwen-tts-realtime

WebSocket

Sintesis streaming, penagihan berbasis token

qwen-tts-realtime-latest

WebSocket

Sintesis streaming, penagihan berbasis token

qwen-tts-realtime-2025-07-15

WebSocket

Versi Snapshot, sintesis streaming, penagihan berbasis token