최근 프로모션
이번에 출시된 Qwen3 시리즈는 다양한 강력한 신규 모델을 포함하고 있습니다. 구체적인 내용은 다음과 같습니다.
● qwen3-max, qwen3-max-2025-09-23: Qwen Max 모델이 '노싱킹(no-thinking)' 모드로 업데이트되었으며, 이전 버전(qwen3-max-preview) 대비 에이전트 프로그래밍 능력, 에이전트 도구 활용 능력, 논리적 추론 능력, 코드 기반 문제 해결 능력 및 텍스트 추론 능력이 크게 향상되었습니다.
● qwen3-vl-plus, qwen3-vl-plus-2025-09-23: Qwen3 시리즈의 비전 언어(VL) 이해 모델로, 시각 코딩, 공간 인지, 다중모달 사고 등 여러 분야에서 전면적으로 업그레이드되었으며 초장시간 동영상 이해를 지원합니다.
● qwen-image-plus: 통의천문(Tongyi Qianwen) 시리즈의 이미지 생성 모델로, 복잡한 텍스트 렌더링과 다양한 생성 및 편집 작업에서 뛰어난 성능을 보입니다.
● qwen3-coder-plus-2025-09-23: Qwen3 기반의 코드 생성 모델로, 이전 버전(7월 22일 스냅샷) 대비 하류 과제 성능과 도구 호출의 견고성(Robustness)이 향상되었으며, 코드 보안성이 강화되었습니다.
● qwen3-livetranslate-flash-realtime, qwen3-livetranslate-flash-realtime-2025-09-22: Qwen3-Omni 시리즈의 실시간 번역 주력 모델 및 스냅샷 모델입니다. 통의천문 3-LiveTranslate-Flash의 실시간 버전으로, 고정밀도, 빠른 응답 속도, 우수한 견고성을 갖춘 다국어 음성/영상 실시간 동시통역 대규모 모델입니다.
영상 생성 2.5 (텍스트-영화 / 이미지-영화)
● 10초 장편 영상: 재생 시간 2배 확대 — 완전한 스토리텔링 지원, 최고 1080P 24fps의 영화급 화질 출력 가능
● 원생 음화 동기화: 고품질 오디오 생성(음성/음악/효과음), 중국어·영어·소수 언어 및 방언까지 지원
● 스마트 명령 제어: 카메라 움직임과 구조화된 프롬프트를 정확히 이해, 복잡한 지시도 한 번에 실행
● ID 일관성 강화: 이미지-영화 변환 시 사실성이 향상되어 얼굴 및 제품 디테일의 왜곡 없음
텍스트-이미지 생성 및 이미지 편집 2.5
● 영화급 질감: 현실적인 조명과 섬세한 디테일로 다양한 미적 스타일 표현 가능
● 문자 및 차트 혁신: 중국어·영어·소수 언어 텍스트뿐 아니라 과학 도표, 플로우차트, 예술 포스터까지 정확하게 생성
● 논리적 명령 처리: 복잡한 작업을 세밀하게 수행하며, IP 캐릭터 재현 능력 크게 향상
● 자연어 편집: 한 문장으로 고급 수준의 사진 보정 가능 — 업계 최고 수준의 명령 이해도
● 이미지 간 일관성: 단일 또는 다중 참조 이미지 하에서 얼굴, 제품, 스타일을 정확하게 유지
FunAudio 백린 시리즈 모델이 Model Studio에 정식 등록되었습니다. 자세한 내용은 다음과 같습니다.
● fun-asr, fun-asr-2025-08-25: 통의랩(Tongyi Lab)에서 선보인 차세대 엔드 투 엔드 음성 인식 대규모 모델로, 뛰어난 문맥 인식 능력과 고정밀 음성 전사 기능을 갖추고 있습니다. 대규모 핫워드 사용자 정의, 민감어/불필요한 말버릇 자동 필터링, ITN(역 텍스트 정규화), 구두점 예측 등의 다양한 기능을 지원하며, 중국어와 영어 간 자유로운 전환이 가능하고 다수 지역의 방언도 폭넓게 지원합니다. 또한 노이즈에 강한 강인성(Robustness)을 보유하여 다양한 복잡한 환경에서도 안정적인 성능을 제공합니다.
● CosyVoice 음성 생성 대규모 모델(cosyvoice-v3, cosyvoice-v3-plus, cosyvoice-v2): 차세대 생성형 음성 모델 기반으로, CosyVoice는 텍스트 이해 기술과 음성 생성 기술을 심층적으로 융합하였습니다. 다양한 텍스트 내용을 정확하게 분석하고 해석하여, 실제 사람의 목소리처럼 자연스러운 음성으로 변환함으로써, 매우 인간 같은 생생한 음성 합성 경험을 제공합니다.
Qwen3: 주요 모델 공개!
모든 Qwen3 모델은 '사고' 모드와 '비사고' 모드를 원활하게 통합하여 대화 중에 모드를 전환할 수 있습니다. Model Studio에서 지금 사용해 보세요!
혁신적인 이중 사고 모드
Qwen3의 고유한 “사고”(심층 추론) 및 “비사고”(빠른 응답) 모드로 비용을 효과적으로 관리하면서 추론 깊이와 속도의 균형을 유연하게 유지합니다.
경량 파워하우스
동일한 크기의 명령어 모델 중 뛰어난 다양성과 작업 실행 정확도 제공
에이전트 향상
고급 자동화 워크플로우를 위한 정확한 툴 사용으로 에이전트 기능 대폭 향상
다국어 우수성
100개 이상의 언어와 방언을 지원하여 매우 안정적인 이해, 번역 및 추론이 가능합니다.
왜 Alibaba Cloud Model Studio인가?
Alibaba Cloud Model Studio는 생성형 AI 개발을 위해 특별히 설계되었습니다. 이 플랫폼을 통해 Qwen-Max, Qwen-Plus, Qwen-Turbo, Qwen-VL 및 Wan 시리즈를 비롯한 업계를 선도하는 Alibaba Cloud의 최신 파운데이션 모델(FM)을 쉽게 경험하고 빠르게 액세스하여 자체 생성형 AI(GenAI) 애플리케이션을 개발할 수 있습니다. 기본 인프라 및 컴퓨팅 성능에 대해 걱정할 필요가 없습니다. 모든 작업은 격리된 VPC 네트워크에서 수행되므로 보안 및 개인 정보 보호 리스크가 줄어듭니다.
-
기능이 강화된 FM
Model Studio는 높은 지능, 다기능, 다국어 지원 기능을 갖춘 플래그십 모델, 저렴한 비용, 빠른 처리 능력, 긴 텍스트 지원 기능을 갖춘 경제적인 모델, 복잡한 작업을 위해 설계되어 정확한 결과를 보장하는 심층 추론 모델, 텍스트, 오디오, 동영상 이해 및 생성을 지원하는 올모달 모델, 이미지와 비디오를 이해할 수 있는 시각 언어 모델, 고급 비디오 생성에 중점을 둔 Wan 시리즈 등 다양한 AI 요구를 충족하는 다양한 파운데이션 모델을 제공합니다.
-
내장된 모델 추론 및 평가 워크플로
실시간 및 배치 모델 추론 작업, 사용자 지정 모델 파라미터 구성, 모델 효과 평가, 모델 성능 관찰 등을 지원하는 Model Studio를 통해 모델 개발, 디버깅, 성능 모니터링을 신속하게 수행하여 엔터프라이즈급 애플리케이션의 보안과 안정성을 보장하는 동시에 개발 프로세스를 가속화하고 비즈니스 리스크를 줄일 수 있습니다.
-
포괄적인 보안 조치
전용 Virtual Private Cloud(VPC) 네트워크에서 모델 및 앱 개발을 완료하고 PrivateLink로 데이터에 액세스하여 저장 및 전송 시 기업 데이터를 보호하고, 프롬프트 및 콘텐츠에 사용자 지정 가능한 콘텐츠 거버넌스를 적용하고, 책임 있는 AI 원칙과 사람의 책임을 위한 툴을 결합합니다
특징
-
Model Playground
Alibaba Cloud의 Qwen, Wan 및 멀티모달 시리즈 모델을 비롯한 다양한 주요 파운데이션 모델(FM)을 사용할 수 있습니다.
-
높은 비용 효율성 및 성능
Model Studio는 Qwen 시리즈 대형 모델에 대한 공식 API를 제공하여 기업이 비즈니스 혁신에 집중하고 기술 유지 관리 부담을 줄일 수 있도록 지원합니다.
-
여러 접속 방법
OpenAI와 호환되는 API를 호출하여 이러한 모델을 불러올 수 있으며, 유연하고 편리한 접속을 위해 DashScope SDK가 함께 제공됩니다.
-
안전하고 효율적인 데이터 전송
Model Studio는 프라이빗 네트워크 접속을 통해 데이터 보안과 전송 효율성을 향상시키며, PrivateLink를 사용하여 전용 VPC 연결을 설정합니다.
콘솔에서 Alibaba Cloud Model Studio를 활성화하여 100만 개의 무료 토큰과 전체 경험을 즐기세요
시나리오
다양한 사용자 니즈에 맞는 풍부한 모델 선택
Qwen
Qwen-Max는 수천억 개의 파라미터를 갖춘 초대형 언어 모델로 중국어와 영어를 포함한 다국어 입력을 지원하며, Qwen-Turbo는 최대 1M의 문맥 길이를 지원하는 빠르고 비용 효율적인 모델로 역시 다국어를 지원합니다.
Wan
Wan은 텍스트-동영상 및 이미지-동영상 생성을 지원합니다. Wan2.1은 복잡한 움직임, 실제 물리 시뮬레이션, 풍부한 예술적 스타일, 영화 같은 시각적 품질을 지원하는 고품질의 시각적 생성을 제공하며, 향상된 지침 준수 기능을 제공합니다.
멀티모달 모델 Qwen-Omni
Qwen-Omni는 텍스트, 이미지, 음성, 동영상 입력은 물론 혼합된 입력도 이해합니다. 또한 텍스트와 음성의 동시 스트리밍 생성을 지원하며, 멀티모달 콘텐츠 이해를 가속화하고 네 가지의 자연스러운 대화 음성을 지원합니다.
향상된 추론 모델 QwQ
QwQ는 강화 학습을 통해 Qwen2.5를 기반으로 학습되며, 추론 능력이 향상되었습니다. 수학 코드(AIME 24/25, LiveCodeBench) 및 일부 일반 지표(IFEval, LiveBench 등)와 같은 모델의 핵심 지표는 DeepSeek-R1 정식 버전 수준에 도달했습니다.
시각적 추론 모델 QVQ
QVQ는 시각적 입력과 Chain-of-Thought 출력을 지원하여 수학, 프로그래밍, 시각적 분석, 콘텐츠 제작 및 일반 지식 작업에서 더욱 강력한 기능을 발휘합니다.
어시스턴트 API를 통한 간편한 에이전트 개발
에이전트 개발을 위한 설계
- Qwen 모델 시리즈 및 지도 학습 미세조정(SFT) 지원
- 즉시 사용 가능한 플러그인 및 사용자 지정 가능한 기능
- 개발자 중심의 SDK 개발 지원
- 빠른 개입 및 기본 메모리 기능 제공
프롬프트 엔지니어링
- 다양한 업무 및 생활 시나리오를 위한 160개 이상의 프롬프트 템플릿
- 사용자 지정을 위한 템플릿 내 변수 구성 가능
- 메타 프롬프트 기반 최적화
- 여러 예시 제공(few-shot) 프롬프트를 위한 예시 선택 툴 제공
기능 향상
- 새로운 알고리즘과 기술로 진화하는 아키텍처
- 프롬프트, 응답 및 작업 실행에 최적화된 Atomic 기능
- OpenAPI와 일치하는 SDK 개발 패러다임
격리된 클라우드 네트워크의 포괄적인 보안 조치
네트워크 보안
네트워크 및 전송 보안: 격리된 VPC 네트워크에서 데이터 세트 관리, 모델 미세조정 및 추론, 에이전트 생성, 앱 개발을 완료할 수 있습니다. 비즈니스가 VPC 네트워크에 구축되어 있든 온프레미스 환경에 구축되어 있든 관계없이, 이러한 프로세스 전반에 걸쳐 안전하고 안정적인 데이터 전송을 보장하여 일관된 성능과 가동 시간을 보장하기 위해 PrivateLink를 통해 Model Studio에 액세스할 수 있습니다. 게이트웨이 액세스 및 포트 포워딩 제한과 같은 네트워크 보안 정책을 사용자 지정할 수도 있습니다.
공격으로부터 보호: Alibaba Cloud Model Studio는 DDoS 공격, CC 공격, 트래픽 클렌징, 웹 템퍼링, 데이터 스크래핑, 웹 취약성, 무단 트래픽 등에 대한 광범위한 보호 기능을 제공합니다.
데이터 보안
데이터 격리: R&D 및 생산 데이터 격리와 R&D 및 생산 환경의 미들웨어 및 리소스(컴퓨팅 및 스토리지) 격리는 위험을 줄이고 개발 프로세스 중에 기업 데이터가 포함되지 않도록 보장합니다.
데이터 스토리지 및 암호화: 로그 데이터는 정기적으로 정리 및 암호화되어 보관되며, OSS의 기업 데이터는 암호화됩니다.
데이터 액세스 관리: 엔터프라이즈 수준의 데이터 액세스 관리 및 데이터 공개 관리를 적용하여 비즈니스 니즈에 맞게 데이터 액세스를 사용자 지정할 수 있습니다.
콘텐츠 보안
생성된 콘텐츠의 보안: Alibaba Cloud Model Studio는 윤리, 가치, 법적 요소 등과 관련하여 생성된 콘텐츠의 위험을 여러 위험 수준에서 자동으로 모니터링하고 식별합니다.
인간 개입: 내장된 개입 툴을 사용하여 사용자 입력, 프롬프트 및 생성된 콘텐츠의 규정 준수 문제를 신속하게 처리할 수 있습니다.