全部产品
Search
文档中心

Alibaba Cloud Model Studio:Event server

更新时间:Jan 22, 2026

Topik ini menjelaskan event sisi server untuk API qwen3-livetranslate-flash-realtime.

Referensi: Terjemahan audio dan video real-time – Qwen

error

Pesan error yang dikembalikan oleh server.

event_id string

Identifier unik untuk event ini.

{
  "event_id": "event_RoUu4T8yExPMI37GKwaOC",
  "type": "error",
  "error": {
    "type": "invalid_request_error",
    "code": "invalid_value",
    "message": "Invalid modalities: ['audio']. Supported combinations are: ['text'] and ['audio', 'text'].",
    "param": "session.modalities"
  }
}

type string

Tipe event. Nilainya selalu error.

error object

Informasi detail mengenai error tersebut.

Properties

type string

Tipe error.

code string

Kode kesalahan.

message string

Pesan error.

param string

Parameter yang terkait dengan error, misalnya session.modalities.

session.created

Setelah klien terhubung, server mengembalikan event ini terlebih dahulu. Event ini berisi konfigurasi default untuk koneksi tersebut.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_QxBGpjBDmDDQQWDtrqBKB",
    "type": "session.created",
    "session": {
        "id": "sess_OozZ1vtbPt2muDflHODIH",
        "object": "realtime.session",
        "model": "qwen3-livetranslate-flash-realtime",
        "modalities": [
            "text",
            "audio"
        ],
        "voice": "Cherry",
        "input_audio_format": "pcm16",
        "output_audio_format": "pcm24",
        "translation": {
           "language": "en"
        }
    }
}

type string

Tipe event. Nilainya selalu session.created.

session object

Konfigurasi sesi.

Properties

id string

Identifier unik untuk sesi tersebut.

object string

Nilainya selalu realtime.session.

model string

Model yang sedang digunakan.

modalities array

Pengaturan modalitas output untuk model tersebut.

voice string

Voice untuk audio yang dihasilkan oleh model.

input_audio_format string

Format audio input. Nilainya selalu pcm16.

output_audio_format string

Format audio output. Nilainya selalu pcm24.

translation object (Opsional)

Konfigurasi terjemahan.

Properties

translation string (Opsional)

Bahasa target untuk terjemahan.

session.updated

Setelah menerima permintaan session.update, server mengembalikan event ini jika permintaan berhasil. Jika terjadi error, server akan mengembalikan event error.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_QxBGpjBDmDDQQWDtrqBKB",
    "type": "session.updated",
    "session": {
        "id": "sess_OozZ1vtbPt2muDflHODIH",
        "object": "realtime.session",
        "model": "qwen3-livetranslate-flash-realtime",
        "modalities": [
            "text",
            "audio"
        ],
        "voice": "Ethan",
        "input_audio_format": "pcm16",
        "output_audio_format": "pcm24",
        "translation": {
           "language": "en"
        }
    }
}

type string

Tipe event. Nilainya selalu session.updated.

session object

Konfigurasi sesi.

Properties

id string

Identifier unik untuk sesi tersebut.

object string

Nilainya selalu realtime.session.

model string

Model yang sedang digunakan.

modalities array

Pengaturan modalitas output untuk model tersebut.

voice string

Voice untuk audio yang dihasilkan oleh model.

input_audio_format string

Format audio input. Nilainya selalu pcm16.

output_audio_format string

Format audio output. Nilainya selalu pcm24.

translation object (Opsional)

Konfigurasi terjemahan.

Properties

translation string (Opsional)

Bahasa target untuk terjemahan.

session.finished

Event ini menunjukkan bahwa sesi telah selesai dan semua terjemahan audio dalam sesi saat ini telah lengkap.

Event ini hanya dikirim setelah klien mengirim permintaan session.finish. Setelah menerima event ini, klien dapat memutus koneksi.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_xxx",
    "type": "session.finished"
}

type string

Tipe event. Nilainya selalu session.finished.

response.created

Saat server menghasilkan respons model baru, server mengembalikan event ini.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_L8hHVI5jYis6BzAjnPWJh",
    "type": "response.created",
    "response": {
        "id": "resp_P79OOMs8LnrXVpiIHUCKR",
        "object": "realtime.response",
        "conversation_id": "conv_UFClXtYkRkFXrs48y8pmK",
        "status": "in_progress",
        "modalities": [
            "text",
            "audio"
        ],
        "voice": "Cherry",
        "output_audio_format": "pcm24",
        "output": []
    }
}

type string

Tipe event. Nilainya selalu response.created.

response object

Objek respons.

Properties

id string

Identifier unik untuk respons tersebut.

conversation_id string

Identifier unik untuk sesi saat ini.

object string

Tipe objek. Untuk event ini, nilainya selalu realtime.response.

status string

Status respons. Nilai yang valid:

  • completed

  • failed

  • in_progress

  • incomplete

modalities array

Modalitas respons.

voice string

Voice dari audio yang dihasilkan.

output_audio_format string

Format audio output. Nilainya tetap pcm24.

output string

Event ini saat ini kosong.

response.done

Server mengembalikan event ini setelah respons dihasilkan. Objek response dalam event ini berisi semua item output kecuali data audio mentah.

event_id string

Identifier unik untuk event ini.

{
  "event_id": "event_CNea8oXNipVanSg2VIzkO",
  "type": "response.done",
  "response": {
    "id": "resp_TfhYTqej692vsGA2jNEtH",
    "object": "realtime.response",
    "conversation_id": "conv_ZtyLfKVm8XqLwYRlsuDih",
    "status": "completed",
    "modalities": [
      "text",
      "audio"
    ],
    "voice": "Cherry",
    "output_audio_format": "pcm24",
    "output": [
      {
        "id": "item_MKtkMwN9RtcyE9eJShyWy",
        "object": "realtime.item",
        "type": "message",
        "status": "completed",
        "role": "assistant",
        "content": [
          {
            "type": "audio",
            "transcript": "Hello? "
          }
        ]
      }
    ],
    "usage": {
      "total_tokens": 56,
      "input_tokens": 47,
      "output_tokens": 9,
      "input_tokens_details": {
        "text_tokens": 20,
        "audio_tokens": 27
      },
      "output_tokens_details": {
        "text_tokens": 2,
        "audio_tokens": 7
      }
    }
  }
}

type string

Tipe event. Nilainya selalu response.done.

response object

Objek respons.

Properties

id string

Identifier unik untuk respons tersebut.

conversation_id string

Identifier unik untuk sesi saat ini.

object string

Tipe objek. Untuk event ini, nilainya selalu realtime.response.

status string

Status respons tersebut.

modalities array

Modalitas respons tersebut.

voice string

Voice yang digunakan untuk audio yang dihasilkan oleh model.

output_audio_format string

Format audio output. Nilainya selalu pcm24.

output object

Output dari respons tersebut.

Properties

id string

Identifier unik untuk output respons tersebut.

type string

Tipe item output. Saat ini nilainya selalu message.

object string

Tipe objek item output. Saat ini nilainya selalu realtime.item.

status string

Status item output tersebut.

role string

Peran item output tersebut.

content array

Konten item output tersebut.

Properties

type string

Tipe konten output. Nilainya adalah text untuk output teks biasa dan audio ketika output mencakup audio.

text string

Konten teks dari output tersebut.

transcript string

Transkripsi teks dari konten audio tersebut.

usage object

Informasi penggunaan token untuk respons ini.

response.text.text

Server mengembalikan event ini ketika modalitas output hanya berupa teks dan model menghasilkan teks secara bertahap.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_B1lIeyOXR7qJMEExbqtTG",
    "type": "response.text.text",
    "response_id": "resp_B1lIdtjF4Noqpn5NOjznj",
    "item_id": "item_B1lIdJsAJlJiFs8ztWpJt",
    "output_index": 0,
    "content_index": 0,
    "text": "How are"
}

type string

Tipe event. Nilainya selalu response.text.text.

text string

Teks bertahap yang dikembalikan.

response_id string

ID respons.

item_id string

Identifier unik untuk item pesan.

output_index integer

Saat ini, nilainya selalu 0.

content_index integer

Saat ini, nilainya selalu 0.

response.text.done

Server mengembalikan event ini ketika model selesai menghasilkan teks untuk output yang hanya berupa teks.

Server juga mengembalikan event ini jika respons terganggu, tidak lengkap, atau dibatalkan.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_B1lIeE2Nac33zn5V7h2mm",
    "type": "response.text.done",
    "response_id": "resp_B1lIdtjF4Noqpn5NOjznj",
    "item_id": "item_B1lIdJsAJlJiFs8ztWpJt",
    "output_index": 0,
    "content_index": 0,
    "text": "How can I assist you today?"
}

type string

Tipe event. Nilainya selalu response.text.done.

response_id string

Identifier unik untuk respons tersebut.

item_id string

Identifier unik untuk item pesan.

output_indexinteger

Saat ini, nilainya selalu 0.

content_indexinteger

Saat ini, nilainya selalu 0.

text string

Output teks lengkap dari model.

response.audio.delta

Server mengembalikan event ini ketika modalitas output mencakup audio dan model menghasilkan data audio secara bertahap.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_B1osWMZBtrEQbiIwW0qHQ",
    "type": "response.audio.delta",
    "response_id": "resp_P79OOMs8LnrXVpiIHUCKR",
    "item_id": "item_OFaPGtzfWCPyGzxnuEX9i",
    "output_index": 0,
    "content_index": 0,
    "delta": "UklGRnoGAABXQVZFZm10IBAAAAAB..."
}

type string

Tipe event. Nilainya selalu response.audio.delta.

response_id string

Identifier unik untuk respons tersebut.

item_id string

Identifier unik untuk item pesan.

output_index integer

Nilainya selalu 0.

content_index integer

Nilainya selalu 0.

delta string

Data audio bertahap yang dioutput oleh model. Data tersebut dienkripsi dalam Base64.

response.audio.done

Jika modalitas output mencakup audio, server mengembalikan event ini setelah proses pembuatan audio selesai.

Server juga mengembalikan event ini jika respons terganggu, tidak lengkap, atau dibatalkan.
Event ini tidak berisi data audio lengkap.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_B1osWMWoDRYyITDyNYcBu",
    "type": "response.audio.done",
    "response_id": "resp_P79OOMs8LnrXVpiIHUCKR",
    "item_id": "item_OFaPGtzfWCPyGzxnuEX9i",
    "output_index": 0,
    "content_index": 0
}

type string

Tipe event. Nilainya selalu response.audio.done.

response_id string

Identifier unik untuk respons tersebut.

item_id string

Identifier unik untuk item pesan.

output_indexinteger

Nilainya selalu 0.

content_indexinteger

Nilainya selalu 0.

conversation.item.input_audio_transcription.text

Ketika parameter input_audio_transcription.model dikonfigurasi, server mengalirkan hasil pengenalan suara dari audio input sebagai teks dalam bahasa sumber aslinya.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_xxx",
    "type": "conversation.item.input_audio_transcription.text",
    "item_id": "item_xxx",
    "content_index": 0,
    "text": "",
    "stash": "The weather is really nice today",
    "language": "zh"
}

type string

Tipe event. Nilainya selalu conversation.item.input_audio_transcription.text.

item_id string

Identifier unik untuk item pesan.

content_index integer

Saat ini, nilainya selalu 0.

text string

Teks pengenalan yang telah dikonfirmasi.

stash string

Teks pengenalan yang masih menunggu konfirmasi. Teks ini dapat diperbaiki oleh event berikutnya.

language string

Bahasa sumber yang terdeteksi.

conversation.item.input_audio_transcription.completed

Ketika parameter input_audio_transcription.model dikonfigurasi, server mengembalikan event ini setelah proses pengenalan suara selesai. Event ini berisi hasil pengenalan akhir yang lengkap.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_xxx",
    "type": "conversation.item.input_audio_transcription.completed",
    "item_id": "item_xxx",
    "content_index": 0,
    "transcript": "The weather is really nice today, let's go for a walk in the park.",
    "language": "zh"
}

type string

Tipe event. Nilainya selalu conversation.item.input_audio_transcription.completed.

item_id string

Identifier unik untuk item pesan.

content_index integer

Saat ini, nilainya selalu 0.

transcript string

Hasil pengenalan suara lengkap dalam bahasa sumber aslinya.

language string

Bahasa sumber yang terdeteksi.

response.audio_transcript.text

Jika modalitas output mencakup audio, server mengembalikan event ini untuk menampilkan terjemahan real-time.

event_id string

Identifier unik untuk event ini.

{
  "event_id": "event_xxx",
  "type": "response.audio_transcript.text",
  "response_id": "resp_xxx",
  "item_id": "item_xxx",
  "output_index": 0,
  "content_index": 0,
  "text": "Hello,",
  "stash": " who are you?"
}

type string

Tipe event. Nilainya selalu response.audio_transcript.text.

response_id string

Identifier unik untuk respons tersebut.

item_id string

Identifier unik untuk item pesan.

output_index integer

Saat ini, nilainya selalu 0.

content_index integer

Saat ini, nilainya selalu 0.

text string

Segmen teks terjemahan yang telah dikonfirmasi.

stash string

Teks sementara dari terjemahan awal. Teks ini digabungkan dengan text saat ini untuk membentuk hasil terjemahan sementara. Sistem terus memperbarui text dan stash melalui event response.audio_transcript.text hingga event response.audio_transcript.done diterima. Pada titik tersebut, Anda dapat mengambil teks terjemahan akhir lengkap dari bidang transcript.

response.audio_transcript.done

Server mengembalikan event ini ketika modalitas output mencakup audio dan model selesai menghasilkan teks.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_VN4Q4GJugLcc1S23viW8E",
    "type": "response.audio_transcript.done",
    "response_id": "resp_P79OOMs8LnrXVpiIHUCKR",
    "item_id": "item_JvJauNH2CTXb1D9WV6pD4",
    "output_index": 0,
    "content_index": 0,
    "transcript": "How can I assist you today?"
}

type string

Tipe event. Nilainya selalu response.audio_transcript.done.

response_id string

Identifier unik untuk respons tersebut.

item_id string

Identifier unik untuk item pesan.

output_index integer

Saat ini, nilainya selalu 0.

content_index integer

Saat ini, nilainya selalu 0.

transcript string

Teks lengkap.

response.output_item.added

Server mengembalikan event ini ketika item output baru dibuat selama proses pembuatan respons.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_B4O5yPt3Gjnjy5eYH3plG",
    "type": "response.output_item.added",
    "response_id": "resp_P79OOMs8LnrXVpiIHUCKR",
    "output_index": 0,
    "item": {
        "id": "item_OFaPGtzfWCPyGzxnuEX9i",
        "object": "realtime.item",
        "type": "message",
        "status": "in_progress",
        "role": "assistant",
        "content": []
    }
}

type string

Tipe event. Nilainya selalu response.output_item.added.

response_id string

Identifier unik untuk respons tersebut.

output_index integer

Saat ini, nilainya selalu 0.

item object

Informasi mengenai item output.

Properties

id string

Identifier unik untuk item output tersebut.

type string

Nilainya selalu message.

object string

Nilainya selalu realtime.item.

status string

Status item output tersebut.

role string

Peran pesan tersebut.

content string

Konten pesan tersebut.

response.output_item.done

Server mengirim event ini ketika sebuah item baru telah sepenuhnya dioutput.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_XkiwbYTBC9Wcdwy6uYJ2G",
    "type": "response.output_item.done",
    "response_id": "resp_P79OOMs8LnrXVpiIHUCKR",
    "output_index": 0,
    "item": {
        "id": "item_JvJauNH2CTXb1D9WV6pD4",
        "object": "realtime.item",
        "type": "message",
        "status": "completed",
        "role": "assistant",
        "content": [
            {
                "type": "audio",
                "text": "Hello, I am a large language model developed by Alibaba Cloud. My name is Qwen. How can I help you?"
            }
        ]
    }
}

type string

Tipe event. Nilainya selalu response.output_item.done.

response_id string

Identifier unik untuk respons tersebut.

output_indexinteger

Saat ini, nilainya selalu 0.

itemobject

Informasi mengenai item output.

Properties

id string

Identifier unik untuk item output tersebut.

object string

Nilainya selalu realtime.item.

type string

Nilainya selalu message.

status string

Status item output tersebut.

role string

Peran pengirim pesan.

content string

Konten pesan tersebut.

response.content_part.added

Event ini dikembalikan oleh server ketika bagian konten baru dioutput.

event_id string

ID unik event tersebut.

{
    "event_id": "event_J2UixwYKZsXg7c9YXZetL",
    "type": "response.content_part.added",
    "response_id": "resp_P79OOMs8LnrXVpiIHUCKR",
    "item_id": "item_OFaPGtzfWCPyGzxnuEX9i",
    "output_index": 0,
    "content_index": 0,
    "part": {
        "type": "audio",
        "text": ""
    }
}

type string

Tipe event. Nilainya selalu response.content_part.added.

response_id string

ID unik respons tersebut.

item_id string

ID unik item pesan.

output_index integer

Nilainya selalu 0.

content_index integer

Nilainya selalu 0.

part object

Informasi item output.

Properties

type string

Tipe bagian konten.

text string

Teks bagian konten.

response.content_part.done

Server mengembalikan event ini setelah bagian konten baru selesai dioutput sepenuhnya.

event_id string

Identifier unik untuk event ini.

{
    "event_id": "event_VN4Q4GJugLcc1S23viW8E",
    "type": "response.content_part.done",
    "response_id": "resp_P79OOMs8LnrXVpiIHUCKR",
    "item_id": "item_JvJauNH2CTXb1D9WV6pD4",
    "output_index": 0,
    "content_index": 0,
    "part": {
        "type": "audio",
        "text": "Hello, I am a large language model developed by Alibaba Cloud. My name is Qwen. How can I help you?"
    }
}

type string

Tipe event. Nilainya selalu response.content_part.done.

response_id string

Identifier unik untuk respons tersebut.

item_id string

Identifier unik untuk item pesan.

output_index integer

Nilainya selalu 0.

content_index integer

Nilainya selalu 0.

part object

Informasi mengenai bagian konten.

Properties

type string

Tipe bagian konten.

text string

Teks bagian konten.