為甚麼選擇靈駿
PAI 靈駿智算服務是面向大規模深度學習及融合智算的 PaaS 產品,支持公共雲 Serverless 版和獨享版形態,基於軟硬件一體優化技術,構建高性能異構算力底座,提供 AI 工程化全流程能力,具備高性能、高效率、高利用率等核心優勢,滿足高性能計算等領域需求,可在大模型訓練、自動駕駛、科研、金融等領域廣泛應用。
-
無服務器 Serverless
公共雲 Serverless 形態助您一鍵快速拉起 AI 計算任務,借助自動運維輕鬆管理複雜的異構系統,並與阿里雲上的計算、儲存、網絡等各類產品無縫銜接。
-
高性能 RDMA 網絡
阿里雲在大型數據中心構建了高性能的 RDMA 網絡,憑藉 800Gbps 的高速低延遲傳輸以及 GPU 直連技術,提高傳輸的穩定性和安全,大幅提升 AI 訓練速度。
-
高效可靠的 CPFS 儲存系統
阿里雲的 CPFS 儲存系統採用全並行儲存架構,支持 POSIX/MPI-IO 和 NFS 協議,單叢集支持高達 2TB/s 的數據吞吐量和 3000 萬的 IOPS,為 AI 訓練提供高效可靠的儲存服務。
-
全面的高性能加速
自研分佈式訓練加速引擎通過數據集加速、計算加速、優化算法、調度算法和資源優化技術等多種手段,充分釋放算力,全面提升 AI 訓練和推理的速度和效率。
產品組合
-
-
PAl 靈駿智算服務 Serverless 版(多租版)
靈駿智算服務 Serverless 版提供靈活且性價比高的選擇。您可按需要購買相關網絡和儲存產品,並根據業務要求一鍵完成擴縮容。 購買計算節點後,無需規劃 CPU 管控節點,實現零成本運維。
-
核心產品:
-
PAI 靈駿智算 GPU
-
CPFS 儲存系統
-
-
PAl 靈駿智算服務獨享版(單租版)
靈駿智算獨享版(單租版)為您建立雲上專屬叢集,讓您的業務獨享專屬的 AI 平台和運維服務,同時利用阿里雲上標準且互通的計算、儲存、網絡等服務,提供便捷的營運管理。
-
核心產品:
-
PAI 靈駿智算 GPU
-
靈駿智算連接
-
CPFS 儲存系統
-
ACK 容器服務靈駿版
-
ECS 雲服務器
-
雲數據庫 RDS
產品功能
新一代 AI 智算平台,滿足大規模 AI 算力需求
企業級 AI 開發平台
提供 AI 開發、訓練等 AI 工程化全流程產品能力,支持多種 AI 角色管理,算力資源管理運維的企業級 AI 平台。
一站式AI計算服務
算力叢集、高性能儲存、容器服務、AI 開發平台的一鍵式開通和全生命週期管理。支持 Serverless 形態,可快速起動 AI 計算任務,運維全面自動化。
易用的分布式計算
大模型訓練只需簡單配置即可自動分佈式並發執行,優化的計算、網絡、通信和儲存架構可提高資源利用率,加快模型訓練速度,讓訓練時間和成本大幅縮減。
叢集管理
通過控制台頁面或 OpenAPI 即可快速的創建叢集,利用豐富的監控指標展示、事件類型以及運行統計,以可視化的方式快速查看運行情況,定位主機和服務異常,並提供從主機、網絡到作業任務的關聯診斷分析工具。方便性能調優和問題溯源。
RDMA網絡
提供高性能的 RDMA 計算網絡、RDMA 儲存網絡和管控網絡,採用高性能和高可用的方式來訪問其它阿里雲服務,具有強安全隔離、分鐘級部署、無級變速、原生高可靠等特點。
高性能儲存
並行 IO 訪問架構,單叢集最高可達 2TB/s 吞吐和 3000 萬 IOPS,支持與雲上和線下儲存數據互通。
應用場景
場景簡介
支持 Serverless 的 AI 研發場景,支持如 Stable Diffusion、Llama 2、OPT 等大模型的訓練,提供深度優化的智能計算服務,可為圖形圖像處理(如 AIGC 圖像生成)、自然語言處理(如 AIGC 文本生成)、語音、視頻等應用場景提供高效、可預期的訓練服務,加速迭代效率。
全局優化、更高效率
-
超高吞吐和 IOPS
針對 AI 訓練場景,數據預先加載至持久化儲存,保障訓練時數據加載和寫入的高帶寬需求,提升訓練效率
-
高資源利用率
對 GPU 資源進行細粒度切分調度,滿足協同開發,技術經雙十一大規模應用驗證,資源利用率可提升 3 倍
場景簡介
超大規模融合算力,支持深度學習和高性能計算作業統一部署調度,為基礎科研、新藥研發、工程仿真等場景構建統一標準計算服務,促進範式創新、效率提升,促進 AI 與 HPC 開發生態融合。
面向創新的融合式開發
-
促進科研新範式
支持雲原生和容器化的 AI 和 HPC 應用生態,為基礎科研、新藥研發、新材料研發等場景提供統一計算服務,支持跨地區、跨團隊協同,提升資源使用率,同時促進技術生態融合,催化協同效應
-
打造科研大平台
基於 RDMA 技術和阿里雲高性能通信庫,構建低時延高帶寬網絡環境,針對 AI+HPC 應用進行通信優化,點對點時延可低至 2us,最大可支持數万節點並行計算,為大規模科學計算提供極具效率優勢的智能計算服務
了解由靈駿加速的阿里雲生成式AI解決方案
開通靈駿
- 您可根據業務需要,購買所需機型的計算節點。
- 1. 登錄智能計算靈駿控制台。
- 2. 在左側導航欄,選擇資源與節點>節點管理。
- 3. 點擊購買新節點,進入計算節點購買頁面。根據界面提示,選擇節點配置,然後單擊立即購買,根據界面提示完成付款。
- 1 個叢集當前最多支持使用 1 個靈駿連接實例來對接公共雲環境。
- 1. 登錄並進入靈駿連接購買頁面。
- 2. 根據界面提示,選擇智算連接規格,然後單擊立即購買,根據界面提示完成付款。
- 阿里雲技術支持人員為您配置完成網絡連通。
- 1. 訪問 CPFS 儲存購買頁面。
- 2. 根據界面提示,選擇CPFS規格信息,然後單擊立即購買,根據界面提示完成付款。
- 說明:CPFS 儲存需要和靈駿處於相同的地域。後續使用過程中,CPFS計費賬單會單獨出賬。