Qwen-Omni-Realtime 是通義千問推出的一款即時音視訊交談模型。它能夠同時理解流式的音頻與映像輸入(例如從視頻流中即時抽取的連續映像幀),並即時輸出高品質的文本與音頻。
如何使用
1. 建立串連
Qwen-Omni-Realtime 模型通過 WebSocket 通訊協定接入,可通過以下 Python 範例程式碼建立串連。也可通過DashScope SDK 建立串連。
請注意,Qwen-Omni-Realtime 的單次 WebSocket 會話最長可持續 30 分鐘。達到此上限後,服務將主動關閉串連。
WebSocket 原生串連
串連時需要以下配置項:
配置項 | 說明 |
調用地址 | 中國大陸(北京):wss://dashscope.aliyuncs.com/api-ws/v1/realtime 國際(新加坡):wss://dashscope-intl.aliyuncs.com/api-ws/v1/realtime |
查詢參數 | 查詢參數為model,需指定為訪問的模型名。樣本: |
要求標頭 | 使用 Bearer Token 鑒權:Authorization: Bearer DASHSCOPE_API_KEY DASHSCOPE_API_KEY 是您在百鍊上申請的API Key。 |
# pip install websocket-client
import json
import websocket
import os
API_KEY=os.getenv("DASHSCOPE_API_KEY")
API_URL = "wss://dashscope-intl.aliyuncs.com/api-ws/v1/realtime?model=qwen3-omni-flash-realtime"
headers = [
"Authorization: Bearer " + API_KEY
]
def on_open(ws):
print(f"Connected to server: {API_URL}")
def on_message(ws, message):
data = json.loads(message)
print("Received event:", json.dumps(data, indent=2))
def on_error(ws, error):
print("Error:", error)
ws = websocket.WebSocketApp(
API_URL,
header=headers,
on_open=on_open,
on_message=on_message,
on_error=on_error
)
ws.run_forever()DashScope SDK
# SDK 版本不低於1.23.9
import os
import json
from dashscope.audio.qwen_omni import OmniRealtimeConversation,OmniRealtimeCallback
import dashscope
# 新加坡和北京地區的API Key不同。擷取API Key:https://www.alibabacloud.com/help/zh/model-studio/get-api-key
# 若沒有配置 API Key,請將下行改為 dashscope.api_key = "sk-xxx"
dashscope.api_key = os.getenv("DASHSCOPE_API_KEY")
class PrintCallback(OmniRealtimeCallback):
def on_open(self) -> None:
print("Connected Successfully")
def on_event(self, response: dict) -> None:
print("Received event:")
print(json.dumps(response, indent=2, ensure_ascii=False))
def on_close(self, close_status_code: int, close_msg: str) -> None:
print(f"Connection closed (code={close_status_code}, msg={close_msg}).")
callback = PrintCallback()
conversation = OmniRealtimeConversation(
model="qwen3-omni-flash-realtime",
callback=callback,
# 以下為新加坡地區url,若使用北京地區的模型,需將url替換為:wss://dashscope.aliyuncs.com/api-ws/v1/realtime
url="wss://dashscope-intl.aliyuncs.com/api-ws/v1/realtime"
)
try:
conversation.connect()
print("Conversation started. Press Ctrl+C to exit.")
conversation.thread.join()
except KeyboardInterrupt:
conversation.close()// SDK 版本不低於 2.20.9
import com.alibaba.dashscope.audio.omni.*;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.google.gson.JsonObject;
import java.util.concurrent.CountDownLatch;
public class Main {
public static void main(String[] args) throws InterruptedException, NoApiKeyException {
CountDownLatch latch = new CountDownLatch(1);
OmniRealtimeParam param = OmniRealtimeParam.builder()
.model("qwen3-omni-flash-realtime")
.apikey(System.getenv("DASHSCOPE_API_KEY"))
// 以下為新加坡地區url,若使用北京地區的模型,需將url替換為:wss://dashscope.aliyuncs.com/api-ws/v1/realtime
.url("wss://dashscope-intl.aliyuncs.com/api-ws/v1/realtime")
.build();
OmniRealtimeConversation conversation = new OmniRealtimeConversation(param, new OmniRealtimeCallback() {
@Override
public void onOpen() {
System.out.println("Connected Successfully");
}
@Override
public void onEvent(JsonObject message) {
System.out.println(message);
}
@Override
public void onClose(int code, String reason) {
System.out.println("connection closed code: " + code + ", reason: " + reason);
latch.countDown();
}
});
conversation.connect();
latch.await();
conversation.close(1000, "bye");
System.exit(0);
}
}2. 配置會話
發送用戶端事件session.update:
{
// 該事件的id,由用戶端產生
"event_id": "event_ToPZqeobitzUJnt3QqtWg",
// 事件類型,固定為session.update
"type": "session.update",
// 會話配置
"session": {
// 輸出模態,支援設定為["text"](僅輸出文本)或["text","audio"](輸出文本與音頻)。
"modalities": [
"text",
"audio"
],
// 輸出音訊音色
"voice": "Cherry",
// 輸入音頻格式,僅支援設為pcm16。
"input_audio_format": "pcm16",
// 輸出音頻格式,僅支援設為pcm24。
"output_audio_format": "pcm24",
// 系統訊息,用於設定模型的目標或角色。
"instructions": "你是某五星級酒店的AI客服專員,請準確且友好地解答客戶關於房型、設施、價格、預訂政策的諮詢。請始終以專業和樂於助人的態度回應,杜絕提供未經證實或超出酒店服務涵蓋範圍的資訊。",
// 是否開啟語音活動檢測。若需啟用,需傳入一個設定物件,服務端將據此自動檢測語音起止。
// 設定為null表示由用戶端決定何時發起模型響應。
"turn_detection": {
// VAD類型,需設定為server_vad。
"type": "server_vad",
// VAD檢測閾值。建議在嘈雜的環境中增加,在安靜的環境中降低。
"threshold": 0.5,
// 檢測語音停止的靜音期間,超過此值後會觸發模型響應
"silence_duration_ms": 800
}
}
}3. 輸入音頻與圖片
用戶端通過input_audio_buffer.append和 input_image_buffer.append 事件發送 Base 64 編碼的音頻和圖片資料到服務端緩衝區。音頻輸入是必需的;圖片輸入是可選的。
圖片可以來自本地檔案,或從視頻流中即時採集。
啟用服務端VAD時,服務端會在檢測到語音結束時自動認可資料並觸發響應。禁用VAD時(手動模式),用戶端必須在發送完資料後,主動調用input_audio_buffer.commit事件來提交。
4. 接收模型響應
模型的響應格式取決於配置的輸出模態。
僅輸出文本
通過response.text.delta事件接收流式文本,response.text.done事件擷取完整文本。
輸出文本+音頻
文本:通過response.audio_transcript.delta事件接收流式文本,response.audio_transcript.done事件擷取完整文本。
音頻:通過response.audio.delta事件擷取 Base 64 編碼的流式輸出音頻資料。response.audio.done事件標誌音頻資料產生完成。
模型列表
Qwen3-Omni-Flash-Realtime 是通義千問最新推出的即時多模態模型,相比於上一代的 Qwen-Omni-Turbo-Realtime(後續不再更新):
支援的語言
增加至 10 種,包括漢語(支援普通話及多種主流方言,如上海話、粵語、四川話等)、英語,法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語,Qwen-Omni-Turbo-Realtime 僅支援 2 種(漢語(普通話)和英語)。
支援的音色
qwen3-omni-flash-realtime-2025-12-01支援的音色增加至49種,qwen3-omni-flash-realtime-2025-09-15、qwen3-omni-realtime-flash增加至 17 種,Qwen-Omni-Turbo-Realtime 僅支援 4 種;具體可查看音色列表。
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 免費額度 |
(Token數) | |||||
qwen3-omni-flash-realtime 當前能力等同 qwen3-omni-flash-realtime-2025-09-15 | 穩定版 | 65,536 | 49,152 | 16,384 | 各100萬Token(不區分模態) 有效期間:百鍊開通後90天內 |
qwen3-omni-flash-realtime-2025-12-01 | 快照版 | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 免費額度 |
(Token數) | |||||
qwen3-omni-flash-realtime 當前能力等同 qwen3-omni-flash-realtime-2025-09-15 | 穩定版 | 65,536 | 49,152 | 16,384 | 無免費額度 |
qwen3-omni-flash-realtime-2025-12-01 | 快照版 | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
快速開始
您需要擷取與配置 API Key並配置API Key到環境變數(準備下線,併入配置 API Key)。
請選擇您熟悉的程式設計語言,通過以下步驟快速體驗與 Realtime 模型即時對話的功能。
DashScope Python SDK
準備運行環境
您的 Python 版本需要不低於 3.10。
首先根據您的作業系統安裝 pyaudio。
macOS
brew install portaudio && pip install pyaudioDebian/Ubuntu
若未使用虛擬環境,可直接通過系統包管理器安裝:
sudo apt-get install python3-pyaudio若使用虛擬環境,需先安裝編譯依賴:
sudo apt update sudo apt install -y python3-dev portaudio19-dev然後在已啟用的虛擬環境中使用 pip 安裝:
pip install pyaudio
CentOS
sudo yum install -y portaudio portaudio-devel && pip install pyaudioWindows
pip install pyaudio安裝完成後,通過 pip 安裝依賴:
pip install websocket-client dashscope選擇互動模式
VAD 模式(Voice Activity Detection,自動檢測語音起止)
服務端自動判斷使用者何時開始與停止說話並作出回應。
Manual 模式(按下即說,鬆開即發送)
用戶端控制語音起止。使用者說話結束後,用戶端需主動發送訊息至服務端。
VAD 模式
建立一個 python 檔案,命名為vad_dash.py,並將以下代碼複製到檔案中:
運行
vad_dash.py,通過麥克風即可與 Qwen-Omni-Realtime 模型即時對話,系統會檢測您的音頻起始位置並自動發送到伺服器,無需您手動發送。Manual 模式
建立一個 python 檔案,命名為
manual_dash.py,並將以下代碼複製進檔案中:運行
manual_dash.py,按 Enter 鍵開始說話,再按一次擷取模型響應的音頻。
DashScope Java SDK
選擇互動模式
VAD 模式(Voice Activity Detection,自動檢測語音起止)
Realtime API 自動判斷使用者何時開始與停止說話並作出回應。
Manual 模式(按下即說,鬆開即發送)
用戶端控制語音起止。使用者說話結束後,用戶端需主動發送訊息至服務端。
VAD 模式
運行OmniServerVad.main()方法,通過麥克風即可與 Realtime 模型即時對話,系統會檢測您的音頻起始位置並自動發送到伺服器,無需您手動發送。
Manual 模式
運行OmniWithoutServerVad.main()方法,按 Enter 鍵開始錄音,錄音過程中再次按 Enter 鍵停止錄音並發送,隨後將接收並播放模型響應。
WebSocket(Python)
準備運行環境
您的 Python 版本需要不低於 3.10。
首先根據您的作業系統來安裝 pyaudio。
macOS
brew install portaudio && pip install pyaudioDebian/Ubuntu
sudo apt-get install python3-pyaudio 或者 pip install pyaudio推薦使用
pip install pyaudio。如果安裝失敗,請先根據您的作業系統安裝portaudio依賴。CentOS
sudo yum install -y portaudio portaudio-devel && pip install pyaudioWindows
pip install pyaudio安裝完成後,通過 pip 安裝 websocket 相關的依賴:
pip install websockets==15.0.1建立用戶端
在本地建立一個 python 檔案,命名為
omni_realtime_client.py,並將以下代碼複製進檔案中:選擇互動模式
VAD 模式(Voice Activity Detection,自動檢測語音起止)
Realtime API 自動判斷使用者何時開始與停止說話並作出回應。
Manual 模式(按下即說,鬆開即發送)
用戶端控制語音起止。使用者說話結束後,用戶端需主動發送訊息至服務端。
VAD 模式
在
omni_realtime_client.py的同級目錄下建立另一個 python 檔案,命名為vad_mode.py,並將以下代碼複製進檔案中:運行
vad_mode.py,通過麥克風即可與 Realtime 模型即時對話,系統會檢測您的音頻起始位置並自動發送到伺服器,無需您手動發送。Manual 模式
在
omni_realtime_client.py的同級目錄下建立另一個 python 檔案,命名為manual_mode.py,並將以下代碼複製進檔案中:運行
manual_mode.py,按 Enter 鍵開始說話,再按一次擷取模型響應的音頻。
互動流程
VAD 模式
將session.update事件的session.turn_detection 設為"server_vad"以啟用 VAD 模式。此模式下,服務端自動檢測語音起止並進行響應。適用於語音通話情境。
互動流程如下:
服務端檢測到語音開始,發送input_audio_buffer.speech_started 事件。
用戶端隨時發送 input_audio_buffer.append與input_image_buffer.append 事件追加音頻與圖片至緩衝區。
發送 input_image_buffer.append 事件前,至少發送過一次 input_audio_buffer.append 事件。
服務端檢測到語音結束,發送input_audio_buffer.speech_stopped 事件。
服務端發送input_audio_buffer.committed 事件提交音頻緩衝區。
服務端發送 conversation.item.created 事件,包含從緩衝區建立的使用者訊息項。
生命週期 | 用戶端事件 | 服務端事件 |
會話初始化 | 會話配置 | 會話已建立 會話配置已更新 |
使用者音頻輸入 | 添加音頻到緩衝區 添加圖片到緩衝區 | input_audio_buffer.speech_started 檢測到語音開始 input_audio_buffer.speech_stopped 檢測到語音結束 伺服器收到提交的音頻 |
伺服器音訊輸出 | 無 | 服務端開始產生響應 響應時有新的輸出內容 對話項被建立 新的輸出內容添加到assistant message response.audio_transcript.delta 增量產生的轉錄文字 模型增量產生的音頻 response.audio_transcript.done 文本轉錄完成 音頻產生完成 Assistant message 的文本或音頻內容流式輸出完成 Assistant message 的整個輸出項串流完成 響應完成 |
Manual 模式
將session.update事件的session.turn_detection 設為 null 以啟用 Manual 模式。此模式下,用戶端通過顯式發送input_audio_buffer.commit 和response.create事件請求伺服器響應。適用於按下即說情境,如聊天軟體中的發送語音。
互動流程如下:
用戶端隨時發送 input_audio_buffer.append與input_image_buffer.append事件追加音頻與圖片至緩衝區。
發送 input_image_buffer.append 事件前,至少發送過一次 input_audio_buffer.append 事件。
用戶端發送input_audio_buffer.commit事件提交音頻緩衝區與映像緩衝區,告知服務端本輪的使用者輸入(音頻及圖片)已全部發送完畢。
服務端響應 input_audio_buffer.committed事件。
用戶端發送response.create事件,等待服務端返回模型的輸出。
服務端響應conversation.item.created事件。
生命週期 | 用戶端事件 | 服務端事件 |
會話初始化 | 會話配置 | 會話已建立 會話配置已更新 |
使用者音頻輸入 | 添加音頻到緩衝區 添加圖片到緩衝區 提交音頻與圖片到伺服器 建立模型響應 | 伺服器收到提交的音頻 |
伺服器音訊輸出 | 清除緩衝區的音頻 | 服務端開始產生響應 響應時有新的輸出內容 對話項被建立 新的輸出內容添加到assistant message 項 response.audio_transcript.delta 增量產生的轉錄文字 模型增量產生的音頻 response.audio_transcript.done 完成文本轉錄 完成音頻產生 Assistant message 的文本或音頻內容流式輸出完成 Assistant message 的整個輸出項串流完成 響應完成 |
API 參考
計費與限流
計費規則
Qwen-Omni-Realtime 模型根據不同模態(音頻、映像)對應的Token數計費。計費詳情請參見模型列表。
限流
模型限流規則請參見限流。
錯誤碼
如果模型調用失敗並返回報錯資訊,請參見錯誤資訊進行解決。
音色列表
使用時將請求參數voice設定為如下表格的“voice參數”列對應的值:qwen3-omni-flash-realtime-2025-12-01模型
音色名 |
| 音色效果 | 描述 | 支援的語種 |
芊悅 | Cherry | 陽光積極、親切自然小姐姐 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
蘇瑤 | Serena | 溫柔小姐姐 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
晨煦 | Ethan | 標準普通話,帶部分北方口音。陽光、溫暖、活力、朝氣 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
千雪 | Chelsie | 二次元虛擬女友 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
茉兔 | Momo | 撒嬌搞怪,逗你開心 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
十三 | Vivian | 拽拽的、可愛的小暴躁 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
月白 | Moon | 率性帥氣的月白 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
四月 | Maia | 知性與溫柔的碰撞 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
凱 | Kai | 耳朵的一場SPA | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
不吃魚 | Nofish | 不會翹舌音的設計師 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
萌寶 | Bella | 喝酒不打醉拳的小蘿莉 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
詹妮弗 | Jennifer | 品牌級、電影質感般美語女聲 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
甜茶 | Ryan | 節奏拉滿,戲感炸裂,真實與張力共舞 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
卡捷琳娜 | Katerina | 禦姐音色,韻律回味十足 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
艾登 | Aiden | 精通廚藝的美語大男孩 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
滄明子 | Eldric Sage | 沉穩睿智的老者,滄桑如松卻心明如鏡 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
乖小妹 | Mia | 溫順如春水,乖巧如初雪 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
沙小彌 | Mochi | 聰明伶俐的小大人,童真未泯卻早慧如禪 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
燕錚鶯 | Bellona | 聲音洪亮,吐字清晰,人物鮮活,聽得人熱血沸騰; 金戈鐵馬入夢來,字正腔圓間盡顯千面人聲的江湖 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
田叔 | Vincent | 一口獨特的沙啞煙嗓,一開口便道盡了千軍萬馬與江湖豪情 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
萌小姬 | Bunny | “萌屬性”爆棚的小蘿莉 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
阿聞 | Neil | 平直的基準語調,字正腔圓的咬字發音,這就是最專業的新聞主持人 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
墨講師 | Elias | 既保持學科嚴謹性,又通過敘事技巧將複雜知識轉化為可消化的認知模組 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
徐大爺 | Arthur | 被歲月和旱煙浸泡過的質樸嗓音,不疾不徐地搖開了滿村的奇聞異事 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
鄰家妹妹 | Nini | 糯米糍一樣又軟又黏的嗓音,那一聲聲拉長了的“哥哥”,甜得能把人的骨頭都叫酥了 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
詭婆婆 | Ebona | 她的低語像一把生鏽的鑰匙,緩慢轉動你內心最深處的幽暗角落——那裡藏著所有你不敢承認的童年陰影與未知恐懼 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
小婉 | Seren | 溫和舒緩的聲線,助你更快地進入睡眠,晚安,好夢 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
頑屁小孩 | Pip | 調皮搗蛋卻充滿童真的他來了,這是你記憶中的小新嗎 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
少女阿月 | Stella | 平時是甜到發膩的迷糊少女音,但在喊出“代表月亮消滅你”時,瞬間充滿不容置疑的愛與正義 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
博德加 | Bodega | 熱情的西班牙大叔 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
索尼莎 | Sonrisa | 熱情開朗的拉美大姐 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
阿列克 | Alek | 一開口,是戰鬥民族的冷,也是毛呢大衣下的暖 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
多爾切 | Dolce | 慵懶的意大利大叔 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
素熙 | Sohee | 溫柔開朗,情緒豐富的韓國歐尼 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
小野杏 | Ono Anna | 鬼靈精怪的青梅竹馬 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
萊恩 | Lenn | 理性是底色,叛逆藏在細節裡——穿西裝也聽後龐克的德國青年 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
埃米爾安 | Emilien | 浪漫的法國大哥哥 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
安德雷 | Andre | 聲音磁性,自然舒服、沉穩男生 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
拉迪奧·戈爾 | Radio Gol | 足球詩人Rádio Gol!今天我要用名字為你們解說足球。 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
上海-阿珍 | Jada | 風風火火的滬上阿姐 | 中文(上海話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
北京-曉東 | Dylan | 北京胡同裡長大的少年 | 中文(北京話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
南京-老李 | Li | 耐心的瑜伽老師 | 中文(南京話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
陝西-秦川 | Marcus | 面寬話短,心實聲沉——老陝的味道 | 中文(陝西話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
閩南-阿傑 | Roy | 詼諧直爽、市井活潑的台灣哥仔形象 | 中文(閩南語)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
天津-李彼得 | Peter | 天津相聲,專業捧哏 | 中文(天津話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
四川-晴兒 | Sunny | 甜到你心裡的川妹子 | 中文(四川話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
四川-程川 | Eric | 一個跳脫市井的四川成都男子 | 中文(四川話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
粵語-阿強 | Rocky | 幽默風趣的阿強,線上陪聊 | 中文(粵語)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
粵語-阿清 | Kiki | 甜美的港妹閨蜜 | 中文(粵語)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 |
qwen3-omni-flash-realtime、qwen3-omni-flash-realtime-2025-09-15模型
音色名 |
| 音色效果 | 描述 | 支援的語種 |
芊悅 | Cherry | 陽光積極、親切自然小姐姐 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
晨煦 | Ethan | 標準普通話,帶部分北方口音。陽光、溫暖、活力、朝氣 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
不吃魚 | Nofish | 不會翹舌音的設計師 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
詹妮弗 | Jennifer | 品牌級、電影質感般美語女聲 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
甜茶 | Ryan | 節奏拉滿,戲感炸裂,真實與張力共舞 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
卡捷琳娜 | Katerina | 禦姐音色,韻律回味十足 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
墨講師 | Elias | 既保持學科嚴謹性,又通過敘事技巧將複雜知識轉化為可消化的認知模組 | 中文、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
上海-阿珍 | Jada | 風風火火的滬上阿姐 | 中文(上海話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
北京-曉東 | Dylan | 北京胡同裡長大的少年 | 中文(北京話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
四川-晴兒 | Sunny | 甜到你心裡的川妹子 | 中文(四川話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
南京-老李 | Li | 耐心的瑜伽老師 | 中文(南京話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
陝西-秦川 | Marcus | 面寬話短,心實聲沉——老陝的味道 | 中文(陝西話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
閩南-阿傑 | Roy | 詼諧直爽、市井活潑的台灣哥仔形象 | 中文(閩南語)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
天津-李彼得 | Peter | 天津相聲,專業捧哏 | 中文(天津話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
粵語-阿強 | Rocky | 幽默風趣的阿強,線上陪聊 | 中文(粵語)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
粵語-阿清 | Kiki | 甜美的港妹閨蜜 | 中文(粵語)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 | |
四川-程川 | Eric | 一個跳脫市井的四川成都男子 | 中文(四川話)、英語、法語、德語、俄語、意大利語、西班牙語、葡萄牙語、日語、韓語 |
Qwen-Omni-Turbo-Realtime模型
音色名 |
| 音色效果 | 描述 | 支援的語種 |
芊悅 | Cherry | 陽光積極、親切自然小姐姐 | 中文、英語 | |
蘇瑤 | Serena | 溫柔小姐姐 | 中文、英語 | |
晨煦 | Ethan | 標準普通話,帶部分北方口音。陽光、溫暖、活力、朝氣 | 中文、英語 | |
千雪 | Chelsie | 二次元虛擬女友 | 中文、英語 |