全部产品
Search
文档中心

Alibaba Cloud Model Studio:Event klien

更新时间:Nov 22, 2025

Topik ini menjelaskan event klien untuk API qwen3-livetranslate-flash-realtime.

Untuk informasi selengkapnya, lihat Terjemahan audio dan video real-time - Qwen.

session.update

Setelah membuat koneksi WebSocket, kirim event ini untuk memperbarui konfigurasi sesi default.

Setelah layanan menerima event session.update, layanan akan memvalidasi parameter. Jika parameter tidak valid, layanan mengembalikan kesalahan. Jika parameter valid, layanan memperbarui dan mengembalikan konfigurasi lengkap.

type string (Wajib)

Jenis event. Nilai ini harus diatur ke session.update.

{
  "event_id": "event_ToPZqeobitzUJnt3QqtWg",
  "type": "session.update",
  "session": {
    "modalities": [
      "text",
      "audio"
    ],
    "voice": "Cherry",
    "input_audio_format": "pcm16",
    "output_audio_format": "pcm24",
    "input_audio_transcription": {
      "language": "en"
    },
    "translation": {
      "language": "zh"
    }
  }
}

session objek (Opsional)

Konfigurasi sesi.

Properti

modalities array (Opsional)

Modalitas keluaran model. Nilai yang valid:

  • ["text"]

    Hanya menghasilkan teks.

  • ["text","audio"] (Default)

    Menghasilkan teks dan audio.

voice string (Opsional)

Suara untuk audio yang dihasilkan. Untuk informasi selengkapnya mengenai nilai yang valid, lihat Suara yang didukung. Nilai default adalah Cherry.

input_audio_transcription objek (Opsional)

Konfigurasi untuk audio masukan.

Properti

language string (Opsional)

Bahasa sumber untuk terjemahan. Untuk informasi selengkapnya mengenai nilai yang valid, lihat Bahasa yang didukung. Nilai default adalah en.

input_audio_format string (Opsional)

Format audio masukan. Saat ini, parameter ini hanya dapat diatur ke pcm16.

output_audio_format string (Opsional)

Format audio keluaran. Saat ini, parameter ini hanya dapat diatur ke pcm24.

translation objek (Opsional)

Konfigurasi terjemahan.

Properti

language string (Opsional)

Bahasa target untuk terjemahan. Untuk informasi selengkapnya mengenai nilai yang valid, lihat Bahasa yang didukung. Nilai default adalah en.

input_audio_buffer.append

Event ini menambahkan byte audio ke buffer audio masukan. Layanan menggunakan buffer ini untuk mendeteksi ucapan dan menentukan kapan harus mengirimkannya.

type string (Wajib)

Jenis event. Nilai ini harus diatur ke input_audio_buffer.append.

{
    "event_id": "event_xxx",
    "type": "input_audio_buffer.append",
    "audio": "xxx"
}

audio string (Wajib)

Data audio yang dikodekan Base64.

input_image_buffer.append

Event ini menambahkan data citra ke buffer citra. Citra dapat berasal dari file lokal atau diambil secara real-time dari aliran video.

Batasan berikut berlaku untuk masukan citra:

  • Format citra harus JPG atau JPEG. Untuk kinerja optimal, resolusi 480p atau 720p direkomendasikan. Resolusi maksimum adalah 1080p.

  • Ukuran satu citra tidak boleh melebihi 500 KB sebelum dikodekan Base64.

  • Data citra harus dikodekan Base64.

  • Frekuensi penambahan citra ke buffer tidak boleh melebihi 2 citra per detik.

  • Anda harus mengirim setidaknya satu event input_audio_buffer.append sebelum mengirim event input_image_buffer.append.

type string (Wajib)

Jenis event. Nilai ini harus diatur ke input_image_buffer.append.

{
    "event_id": "event_xxx",
    "type": "input_image_buffer.append",
    "image": "xxx"
}

image string (Wajib)

Data citra yang dikodekan Base64.