概要
Alibaba Cloud の生成 AI 向けフルスタックソリューション (GenAI) には、基盤モデル (FM) やその他の AI 開発タスクプロセス全体を網羅するサービスが用意されています。 このソリューションにより、FM を構築して最適化し、ビジネスの要件に応じてファインチューニングを行い、オンラインサービスとして簡単にデプロイできます。これらすべてを、パフォーマンスと効率が最適化された専用の AI インフラストラクチャ上にで実行できます。 ビジネスの規模や段階に関係なく、このソリューションを使用することにより、新しいインテリジェントなカスタマーエクスペリエンスを作成し、生成 AI の革新によるビジネスの変革を推進できます。
• AI のためのハードウェアとソフトウェアの統合アクセラレーション
1. モデルのトレーニングと推論のための GPU
モデルのトレーニング:gn7 シリーズの ECS インスタンスでは、高性能のGPU で大規模なトレーニングタスクが強化されています
モデル推論:gn6 シリーズの ECS インスタンスでは、モデル推論タスクで費用対効果の高い方法を選択できます
2. AI アクセラレーション
GPU Accelerator AIACC を利用すると、Stanford DAWN Deep Learning Benchmark に従って、AI トレーニングタスクを最大 70%、推論タスクを 2 倍 ~ 3 倍高速化できます。
データの準備
インテリジェント、カスタマイズ可能、高効率のマルチモーダルデータラベリングサービスを使用して、モデルトレーニング用のデータを準備
モデルの開発
ワンストップの視覚化モデリングツールである PAI-Designer を使用して基盤モデルを構築、または PAI-DSW で Notebook を使用したインタラクティブな開発を実行
モデルのトレーニング
事前定義され、カスタマイズされたアルゴリズムフレームワークとの互換性を備えた、クラウドネイティブの深層学習およびトレーニング用のワンストッププラットフォームである PAI-DLC を使用してモデルをトレーニング
モデルのデプロイ
大規模かつ複雑なモデルのプッシュボタンデプロイをサポートする PAI-EAS で、モデルをオンラインサービスまたは Web アプリとしてデプロイ<
Tongyi Qianwen (Qwen)
Alibaba Cloud では、フラッグシップ LLM である Qwen-Max と Qwen-Plus、マルチモーダルモデルの Qwen-Omni、Qwen-VL、および Qwen-Audio、推論モデルの QVQ と QwQ、推論モデル、垂直モデルの Qwen-CoderとQwen-Math など、一連のオープンソース Tongyi Qianwen モデルを提供しています。 Qwen モデルは、さまざまな業界やドメインを網羅する多言語データについて事前にトレーニングされており、マルチモーダルな理解と生成、最先端の画像処理、生成 AI のイノベーションをサポートするフルマネージド API など、幅広い機能を備えています。 最新の Qwen3 では、コストを節約しながら推論の深さと速度のバランスをとるために、「思考」 (深い推論のため) モードと「非思考」 (高速な応答のため) モードを柔軟に切り替えることができる独自の「デュアル思考モード」を採用しています。 軽量でありながら強力であり、同サイズのモデルの中では精度と汎用性において同業他社を上回り、119 の言語と方言の多言語機能で言語の壁を打ち破ります。
Qwen モデルをエンタープライズデータで簡単にファインチューニングし、ビジネスを理解するオンラインサービスとしてデプロイできます。
Wan2.1
Wan2.1 は、テキストからビデオ、および画像からビデオを生成するための、オープンソースで汎用性の高いビデオ基盤モデルスイートです。 複雑な動きの正確な処理、ピクセル品質の向上、物理的な原理の順守、命令実行精度の最適化により、リアルなビジュアルの生成に優れています。
DeepSeek
DeepSeek-V3 は、混合専門家 (MoE) アーキテクチャを組み合わせた高性能 LLM です。 DeepSeek-R1 は DeepSeek-V3-Base に基づいてトレーニングされています。 PAI のモデルギャラリーには、BladeLLM、SGLang、vLLM などの高速デプロイオプションが用意されているため、ワンクリックで DeepSeek モデルをデプロイできます。
Llama 3
LLaMA 3 は、大規模なトレーニングデータを備えた強力なオープンソースLLMです。 イノベーション、スケーラビリティ、シンプルさに焦点が当てられ、前身の LLaMA 2 に比べていくつかのアーキテクチャが改善されています。 簡単な手順で、Platform for AI (PAI) を使用して LLaMA 3 にアクセス、ファインチューニング、およびデプロイできます。

組み込みのモデル推論と評価のワークフロー
SFT と LoRA をサポートするように設計された包括的なツール、組み込みのモデル圧縮と推論の高速化、視覚化されたテンプレートでの多次元モデル評価、ワンクリックのモデルのデプロイ

AnalyticDB を使用したワンクリックの RAG セットアップ
Model Studio は、詳細な検索最適化を AnalyticDB と共同で適用します。AnalyticDB for PostgreSQL は、100 億を超えるベクトルの検索機能を提供し、さまざまな Alibaba Cloud AI プロダクトとの互換性を備えています。RAG について詳しく見る >

広範囲のセキュリティ対策
専用の Virtual Private Cloud (VPC) ネットワークでモデルとアプリの開発を完了し、PrivateLink を使用してデータにアクセスし、プロンプトとコンテンツにカスタマイズ可能なコンテンツガバナンスを適用し、責任ある AI の原則と人間の説明責任のためのツールを組み合わせて、ストレージと転送でエンタープライズデータを保護

Smart Studio
Smart Studio は、生成 AI を搭載したオールインワンプラットフォームです。1 つのワークスペースで多様なコンテンツを作成できます。 標準装備の機能と事前定義済みのワークフローはさまざまな業界シナリオに合わせて調整されているため、すばらしい画像やビデオコンテンツを簡単に作成できます。

AI Doc
AI Docは、Qwen モデルを含む LLM の力で企業のデジタルドキュメント管理に革命をもたらします。 さまざまなドキュメントを効率的に解析し、ビジネス要件に基づいて情報を正確に抽出し、カスタマイズされたドキュメントを迅速に生成します。

自動音声認識
このソリューションは、複雑な環境において高い精度で音声をオーディオおよびビデオファイルからテキストに変換し、多言語のコンテキストで英語、北京語、および広東語の音声を識別します。今後、さらに多くの言語に対応予定です。

Lingma
Alibaba Cloud の Lingma は、Qwen モデルを活用してコーディングを支援するものです。 インテリジェントなコード生成、開発者向けの AI チャット、マルチファイルコード変更、自動コード実行機能などの機能を備えています。