最新情報
Qwen-Image-2.0 は、Qwen によるプロフェッショナルグレードの画像生成モデルであり、専門的なインフォグラフィック作成と精巧なフォトリアル画像の制作に特化しています。
今回アップデートの核心機能:
📝 テキストレンダリング: 1k token の指示入力に対応、PPT/ポスター/漫画などの専門的なインフォグラフィックを直接出力可能
🖼️ 実写感ある質感: 2K 解像度に対応、人物/自然/建築などの実写シーンを繊細に描写
✂️ 生成+編集の一体化: 理解と生成機能を統合、単一モデルで画像の生成と編集の両方をサポート
⚡ 軽量アーキテクチャ: モデルサイズを小型化、生成速度を高速化、効果とパフォーマンスの最適なバランスを実現
Qwen3.5-Plus ネイティブマルチモーダルモデルを正式リリースいたします。事前学習段階からテキストと視覚の表現を統合構築し、真にネイティブなマルチモーダル理解を実現。多様な実用シーンに柔軟に対応可能です。能力向上のポイントは以下の3点です:
● 広がり:言語理解、論理的推論、コード生成、エージェントタスク、画像/動画理解、GUI操作などにおいて、トップクラスモデルと同等の性能を発揮
● 深さ:コード・エージェント分野で高い汎用性を有し、開発者および企業ユーザーの生産性向上に直結
● コスト効率:テキスト単体タスクでは Qwen3 Max と同等(またはそれ以上)の性能を、大幅に低いコストで達成;マルチモーダル能力は Qwen3 VL シリーズ比で質的な飛躍を遂げています
🎥 動画: 15秒の高精度キャラクター一貫性、完璧な音声同期;一文のプロンプトでプロ級マルチショットシーケンスを生成(専門的なカメラワークと分鏡を含む);わずか2-10秒の素材からキャラクターの声と外見を高精度で複製。複数キャラクター/アニメ/物体を完全サポート、放送級品質を実現。
🎨 画像: 革新的な複数画像の一貫性向上、ピクセル単位のスタイル制御、高精度テキストレンダリング、インテリジェントレイアウト最適化—クリエイティブ作業効率が2倍に向上。
🎵 音楽: ジャンル/楽器/感情を精密に制御可能なカスタム3-4分曲;複数ボーカルサポートと多言語歌詞機能を搭載、リーズナブルな価格設定。
Qwen3.5:主要モデルが発表されました
すべての Qwen3 モデルで思考モードと非思考モードがシームレスに統合され、会話中にモードを切り替えることができます。 Model Studio で今すぐお試しください
ネイティブなマルチモーダル対応
本モデルは、トレーニング段階でQwen3テキスト専用モデルとVLシリーズを統合したネイティブな視覚言語モデルであり、ユーザーの多様な実用シナリオに対応可能です。
軽量で強力
同サイズの指示モデルと比較して汎用性とタスク実行精度が向上しています。
エージェント強化
高度な自動化ワークフローのための正確なツールの使用により、エージェント機能が大幅に強化されています。
多言语に精通
信頼性の高い理解、翻訳、推論を実行するために、100 を超える言語と方言をサポートしています。
Alibaba Cloud Model Studio を選ぶ理由
Alibaba Cloud Model Studio は、生成 AI を開発するために特別に設計されています。 このプラットフォームにより、Qwen3-Max、Qwen-Plus、Qwen-Flash、Qwen-VL、Wan シリーズなど、Alibaba Cloud の最新の業界をリードする基盤モデル (FM) を簡単に体験してすばやくアクセスし、独自の生成 AI (GenAI) アプリケーションを開発できます。 基盤となるインフラストラクチャとコンピューティングパワーについて心配する必要はありません。 すべての操作は分離された VPC ネットワークで実行されるため、セキュリティとプライバシーのリスクが軽減されます。
-
機能が強化された FM
Model Studio では、高インテリジェンス、多機能、多言語サポートを備えたフラッグシップモデル、低コスト、高速処理機能、および長いテキストサポートを備えた経済的なモデル、正確な結果を確保するための複雑なタスク用に設計された深い推論モデル。テキスト、オーディオ、ビデオの理解と生成をサポートするオールモーダルモデル、高度なビデオ生成に特化した Wan シリーズなど、さまざまな AI ニーズを満たすための基盤モデルが用意されています。
-
組み込みのモデル推論と評価のワークフロー
Model Studio でサポートされるリアルタイムおよびバッチモデル推論タスク、ユーザー定義のモデルパラーメーター設定、モデル効果の評価、モデルパフォーマンスの監視などを利用して、モデル開発、デバッグ、パフォーマンスモニタリングを迅速に実行して、開発プロセスを加速し、ビジネスリスクを軽減しながらエンタープライズレベルのアプリケーションのセキュリティと安定性を確保できます。
-
広範囲のセキュリティ対策
専用の Virtual Private Cloud (VPC) ネットワーク内でモデルのカスタマイズとアプリケーションを開発完了し、PrivateLink を使用してデータにアクセス。また、プロンプトとコンテンツにカスタマイズ可能なコンテンツガバナンスを適用し、さらに責任ある AI (Responsible AI)の原則と、人による手動設定が可能なツールを組み合わせることで、データのストレージと転送における安全性を保証
特徴
-
モデルプレイグラウンド
Alibaba Cloud の Qwen、Wan、マルチモーダルシリーズモデルなど、さまざまな主要な基盤モデル (FM) を利用できます。
-
高い費用対効果とパフォーマンス
Model Studio は、Qwen シリーズの大規模モデル用公式 API を備えています。企業はビジネスイノベーションに注力し、技術メンテナンスの負担を軽減できます。
-
複数のアクセス方法
これらのモデルは、OpenAI と互換性があり、DashScope SDK に付属する API を呼び出しすことにより柔軟かつ便利にアクセスできます。
-
安全で効率的なデータ伝送
Model Studio では、PrivateLink を使用して専用 VPC 接続が確立され、プライベートネットワークアクセスによりデータのセキュリティと伝送効率が向上しています。
コンソールで Alibaba Cloud Model Studio をアクティブ化すると、100 万トークンを無料で利用でき、すべての機能をご体験いただけます
シナリオ
多様なユーザーニーズに合わせた豊富なモデルセレクション
Qwen
Qwen-Max は、中国語と英語を含む多言語入力をサポートする数千億のパラメーターを備えた超大規模言語モデルです。Qwen-Turbo は、最大 1 M のコンテキスト長を持つ高速かつ費用対効果の高いモデルであり、複数の言語もサポートしています。
Wan
Wan では、テキストからビデオの生成と画像からビデオの生成がサポートされています。 Wan2.1 は、より高品質な画像を生成し、複雑な動き、実際の物理シミュレーション、豊かな芸術的スタイル、映画のようなビジュアル品質をサポートし、指示に従う機能が向上しています。
マルチモーダルモデル Qwen-Omni
Qwen-Omni は、テキスト、画像、音声、およびビデオの入力、およびそれらを組み合わせた入力を理解します。 また、テキストと音声両方の同時ストリーミング生成がサポートされ、マルチモーダルコンテンツの理解がより短時間で行われ、さらに 4 種類の自然な会話音声がサポートされています。
強化された推論モデル QwQ
QwQ は、強化学習を通じて Qwen2.5 に基づいてトレーニングされ、推論能力が向上しています。 このモデルの主要な指標は、数学コード (AIME 24/25、LiveCodeBench) やその他の一般的な指標 (IFEval、LiveBenchなど) などで DeepSeek-R1 完全版のレベルに達しています。
視覚的推論モデル QVQ
QVQ は、視覚入力と思考連鎖出力をサポートし、数学、プログラミング、視覚分析、コンテンツ作成、および一般的な知識タスクにおいてより強力な機能を発揮します。
アシスタントAPI を使用して簡単にエージェントを開発
エージェント開発専用設計
-Qwen モデルシリーズと教師ありファインチューニング (SFT) のサポート
- すぐに使用できるプラグインとカスタマイズ可能な機能
- 開発者向けの SDK 開発サポート
- 迅速な介入と基本的なメモリ機能
プロンプトエンジニアリング
- さまざまな仕事と生活シナリオに対して 160 を超えるプロンプトテンプレートを用意
- カスタマイズ可能なテンプレートで変数を設定可能
- メタプロンプトに基づく最適化
- 数種類のプロンプト用のツールの選択例
強化された機能
- 新しいアルゴリズムとテクノロジーによって進化するアーキテクチャ
- プロンプト、応答、タスク実行用に最適化されたアトミック関数
- OpenAPI と一致する SDK 開発パラダイム
分離型クラウドネットワークの幅広いセキュリティ対策
ネットワークセキュリティ
ネットワークと伝送のセキュリティ:分離された VPC ネットワークで、データセットの管理、モデルのファインチューニングと推論、エージェントの作成、アプリ開発を完了できます。 ビジネスが VPC ネットワークにデプロイされている場合でも、オンプレミス環境にデプロイされている場合でも、PrivateLink を使用して Model Studio にアクセスし、プロセス全体で安全で信頼性の高いデータ伝送を保証し、一貫したパフォーマンスと稼働時間を実現できます。 ゲートウェイアクセスやポート転送の制限など、ネットワークセキュリティポリシーをカスタマイズすることもできます。
攻撃に対する保護:Alibaba Cloud Model Studioでは、DDoS 攻撃、CC 攻撃、トラフィッククレンジング、Web テンパリング、データスクレイピング、Web 脆弱性、不正トラフィックなどに対する広範な保護が提供されます。
データセキュリティ
データ分離:研究開発環境と本番環境のミドルウェアとリソース (コンピューティングとストレージ) の分離を含む研究開発環境と本番環境のデータ分離を行うことで、リスクを軽減し、開発プロセスへのエンタープライズデータの関与を確実に防止できます。
データストレージと暗号化:ログデータはアーカイブ用に定期的にクリーニングおよび暗号化され、OSS 内のエンタープライズデータは暗号化されます。
データアクセス管理:エンタープライズレベルのデータアクセス管理とデータ開示管理を適用して、ビジネスニーズに合わせてデータアクセスをカスタマイズできます。
コンテンツセキュリティ
生成されたコンテンツのセキュリティ:Alibaba Cloud Model Studio は、倫理、価値、法的要因などに関する、生成されたコンテンツのリスクを複数のリスクレベルで自動的に監視および識別します。
手動介入:組み込みの介入ツールを使用して、ユーザー入力、プロンプト、および生成されたコンテンツのコンプライアンスの問題に迅速に対処できます。
