最新情報
今回リリースされたQwen3シリーズには、多数の高性能な新モデルが含まれています。詳細は以下の通りです。
● qwen3-max、qwen3-max-2025-09-23:Qwen Maxが「ノーシンキング(no-thinking)」モードに更新され、従来版(qwen3-max-preview)と比較して、エージェントによるプログラミング能力、ツール活用能力、論理的推論能力、コードを用いた問題解決能力およびテキスト推論能力が大幅に向上しています。
● qwen3-vl-plus、qwen3-vl-plus-2025-09-23:Qwen3シリーズの視覚理解モデルで、ビジュアルコーディング、空間認識、マルチモーダル思考などの分野で全面的にアップグレードされており、超長時間の動画理解もサポートします。
● qwen-image-plus:通義千問シリーズの画像生成モデルで、複雑なテキストレンダリングや各種生成・編集タスクにおいて優れた性能を発揮します。
● qwen3-coder-plus-2025-09-23:Qwen3に基づくコード生成モデルであり、前バージョン(7月22日スナップショット)と比べて下流タスクのパフォーマンスおよびツール呼び出しの堅牢性(ロバスト性)が向上し、コードのセキュリティも強化されています。
● qwen3-livetranslate-flash-realtime、qwen3-livetranslate-flash-realtime-2025-09-22:Qwen3-Omniシリーズのリアルタイム翻訳向け主力モデルおよびスナップショットモデルです。通義千問3-LiveTranslate-Flashのリアルタイム版であり、高精度・高速応答・高堅牢性を備えた多言語音声・映像リアルタイム通訳大規模モデルです。
動画生成 2.5(テキスト→動画/画像→動画)
● 10秒の長尺動画:再生時間2倍に延長。完結したストーリーテリングをサポートし、最大1080P・24fpsの映画品質出力が可能
● ネイティブ音声映像同期:高忠実度オーディオ生成(ボイス/音楽/効果音)。中国語・英語・少数言語および方言にも対応
● スマートコマンド制御:カメラワークや構造化プロンプトを正確に理解。複雑な指示もワンクリックで実行
● ID一貫性の強化:画像から動画への変換精度が向上。顔や商品のディテールに歪みなし
テキスト→画像/画像編集 2.5
● 映画級の質感:リアルな光と陰影、細部までこだわった描写で多様な美的スタイルに対応
● テキスト・図表の革新:中国語・英語・少数言語のテキストに加え、科学図表、フローチャート、アートポスターを正確に生成
● 論理的コマンド処理:複雑なタスクも細かく実行。IPキャラクターの再現力が飛躍的に向上
● 自然言語編集:一文で高度な画像編集が可能。指示の遵守能力は業界トップレベル
● 画像間の一貫性:単一または複数の参照画像に基づき、顔・商品・スタイルを正確に保持
FunAudio 百聆シリーズのモデルがModel Studioに公開されました。詳細は以下の通りです。
● fun-asr、fun-asr-2025-08-25:通義ラボが開発した新世代エンドツーエンド音声認識大規模モデル。優れたコンテキスト認識能力と高精度な音声文字変換機能を備えています。大規模なホットワードカスタマイズ、センシティブワード/フィラー語の自動フィルタリング、ITN(逆テキスト正規化)、句読点予測などの多様な機能をサポート。中国語と英語の自由切り替え、複数地域の方言対応も可能で、ノイズに対するロバスト性も強化され、さまざまな複雑な環境にも適応します。
● CosyVoice 音声生成大規模モデル(cosyvoice-v3、cosyvoice-v3-plus、cosyvoice-v2):次世代生成型音声モデルをベースに、CosyVoice はテキスト理解と音声生成技術を深く統合しています。さまざまなテキスト内容を正確に解析・解釈し、まるで人が話しているかのように自然な音声へと変換。高い擬人化性能を持つ、極めて自然な音声合成体験を提供します。
Qwen3:主要モデルが発表されました
すべての Qwen3 モデルで思考モードと非思考モードがシームレスに統合され、会話中にモードを切り替えることができます。 Model Studio で今すぐお試しください
革新的なデュアル思考モード
Qwen3 のユニークな思考 (深層推論) と非思考 (高速応答) モードでコストを効果的に管理しながら、推論の深さと速度を柔軟にバランスさせています。
軽量で強力
同サイズの指示モデルと比較して汎用性とタスク実行精度が向上しています。
エージェント強化
高度な自動化ワークフローのための正確なツールの使用により、エージェント機能が大幅に強化されています。
多言语に精通
信頼性の高い理解、翻訳、推論を実行するために、100 を超える言語と方言をサポートしています。
Alibaba Cloud Model Studio を選ぶ理由
Alibaba Cloud Model Studio は、生成 AI を開発するために特別に設計されています。 このプラットフォームにより、Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen-VL、Wan シリーズなど、Alibaba Cloud の最新の業界をリードする基盤モデル (FM) を簡単に体験してすばやくアクセスし、独自の生成 AI (GenAI) アプリケーションを開発できます。 基盤となるインフラストラクチャとコンピューティングパワーについて心配する必要はありません。 すべての操作は分離された VPC ネットワークで実行されるため、セキュリティとプライバシーのリスクが軽減されます。
-
機能が強化された FM
Model Studio では、高インテリジェンス、多機能、多言語サポートを備えたフラッグシップモデル、低コスト、高速処理機能、および長いテキストサポートを備えた経済的なモデル、正確な結果を確保するための複雑なタスク用に設計された深い推論モデル。テキスト、オーディオ、ビデオの理解と生成をサポートするオールモーダルモデル、高度なビデオ生成に特化した Wan シリーズなど、さまざまな AI ニーズを満たすための基盤モデルが用意されています。
-
組み込みのモデル推論と評価のワークフロー
Model Studio でサポートされるリアルタイムおよびバッチモデル推論タスク、ユーザー定義のモデルパラーメーター設定、モデル効果の評価、モデルパフォーマンスの監視などを利用して、モデル開発、デバッグ、パフォーマンスモニタリングを迅速に実行して、開発プロセスを加速し、ビジネスリスクを軽減しながらエンタープライズレベルのアプリケーションのセキュリティと安定性を確保できます。
-
広範囲のセキュリティ対策
専用の Virtual Private Cloud (VPC) ネットワーク内でモデルのカスタマイズとアプリケーションを開発完了し、PrivateLink を使用してデータにアクセス。また、プロンプトとコンテンツにカスタマイズ可能なコンテンツガバナンスを適用し、さらに責任ある AI (Responsible AI)の原則と、人による手動設定が可能なツールを組み合わせることで、データのストレージと転送における安全性を保証
特徴
-
モデルプレイグラウンド
Alibaba Cloud の Qwen、Wan、マルチモーダルシリーズモデルなど、さまざまな主要な基盤モデル (FM) を利用できます。
-
高い費用対効果とパフォーマンス
Model Studio は、Qwen シリーズの大規模モデル用公式 API を備えています。企業はビジネスイノベーションに注力し、技術メンテナンスの負担を軽減できます。
-
複数のアクセス方法
これらのモデルは、OpenAI と互換性があり、DashScope SDK に付属する API を呼び出しすことにより柔軟かつ便利にアクセスできます。
-
安全で効率的なデータ伝送
Model Studio では、PrivateLink を使用して専用 VPC 接続が確立され、プライベートネットワークアクセスによりデータのセキュリティと伝送効率が向上しています。
コンソールで Alibaba Cloud Model Studio をアクティブ化すると、100 万トークンを無料で利用でき、すべての機能をご体験いただけます
シナリオ
多様なユーザーニーズに合わせた豊富なモデルセレクション
Qwen
Qwen-Max は、中国語と英語を含む多言語入力をサポートする数千億のパラメーターを備えた超大規模言語モデルです。Qwen-Turbo は、最大 1 M のコンテキスト長を持つ高速かつ費用対効果の高いモデルであり、複数の言語もサポートしています。
Wan
Wan では、テキストからビデオの生成と画像からビデオの生成がサポートされています。 Wan2.1 は、より高品質な画像を生成し、複雑な動き、実際の物理シミュレーション、豊かな芸術的スタイル、映画のようなビジュアル品質をサポートし、指示に従う機能が向上しています。
マルチモーダルモデル Qwen-Omni
Qwen-Omni は、テキスト、画像、音声、およびビデオの入力、およびそれらを組み合わせた入力を理解します。 また、テキストと音声両方の同時ストリーミング生成がサポートされ、マルチモーダルコンテンツの理解がより短時間で行われ、さらに 4 種類の自然な会話音声がサポートされています。
強化された推論モデル QwQ
QwQ は、強化学習を通じて Qwen2.5 に基づいてトレーニングされ、推論能力が向上しています。 このモデルの主要な指標は、数学コード (AIME 24/25、LiveCodeBench) やその他の一般的な指標 (IFEval、LiveBenchなど) などで DeepSeek-R1 完全版のレベルに達しています。
視覚的推論モデル QVQ
QVQ は、視覚入力と思考連鎖出力をサポートし、数学、プログラミング、視覚分析、コンテンツ作成、および一般的な知識タスクにおいてより強力な機能を発揮します。
アシスタントAPI を使用して簡単にエージェントを開発
專為代理開發而設計
-Qwen モデルシリーズと教師ありファインチューニング (SFT) のサポート
- すぐに使用できるプラグインとカスタマイズ可能な機能
- 開発者向けの SDK 開発サポート
- 迅速な介入と基本的なメモリ機能
プロンプトエンジニアリング
- さまざまな仕事と生活シナリオに対して 160 を超えるプロンプトテンプレートを用意
- カスタマイズ可能なテンプレートで変数を設定可能
- メタプロンプトに基づく最適化
- 数種類のプロンプト用のツールの選択例
強化された機能
- 新しいアルゴリズムとテクノロジーによって進化するアーキテクチャ
- プロンプト、応答、タスク実行用に最適化されたアトミック関数
- OpenAPI と一致する SDK 開発パラダイム
分離型クラウドネットワークの幅広いセキュリティ対策
ネットワークセキュリティ
ネットワークと伝送のセキュリティ:分離された VPC ネットワークで、データセットの管理、モデルのファインチューニングと推論、エージェントの作成、アプリ開発を完了できます。 ビジネスが VPC ネットワークにデプロイされている場合でも、オンプレミス環境にデプロイされている場合でも、PrivateLink を使用して Model Studio にアクセスし、プロセス全体で安全で信頼性の高いデータ伝送を保証し、一貫したパフォーマンスと稼働時間を実現できます。 ゲートウェイアクセスやポート転送の制限など、ネットワークセキュリティポリシーをカスタマイズすることもできます。
攻撃に対する保護:Alibaba Cloud Model Studioでは、DDoS 攻撃、CC 攻撃、トラフィッククレンジング、Web テンパリング、データスクレイピング、Web 脆弱性、不正トラフィックなどに対する広範な保護が提供されます。
データセキュリティ
データ分離:研究開発環境と本番環境のミドルウェアとリソース (コンピューティングとストレージ) の分離を含む研究開発環境と本番環境のデータ分離を行うことで、リスクを軽減し、開発プロセスへのエンタープライズデータの関与を確実に防止できます。
データストレージと暗号化:ログデータはアーカイブ用に定期的にクリーニングおよび暗号化され、OSS 内のエンタープライズデータは暗号化されます。
データアクセス管理:エンタープライズレベルのデータアクセス管理とデータ開示管理を適用して、ビジネスニーズに合わせてデータアクセスをカスタマイズできます。
コンテンツセキュリティ
生成されたコンテンツのセキュリティ:Alibaba Cloud Model Studio は、倫理、価値、法的要因などに関する、生成されたコンテンツのリスクを複数のリスクレベルで自動的に監視および識別します。
手動介入:組み込みの介入ツールを使用して、ユーザー入力、プロンプト、および生成されたコンテンツのコンプライアンスの問題に迅速に対処できます。