PAI 靈駿智算服務

全面的 AI 計算平台,滿足大型語言模型(LLM)訓練等高性能計算的算力和性能需求

PAI 靈駿智算服務目前僅部署在中國的烏蘭察布和新加坡。請聯絡銷售團隊以獲得購買諮詢服務。

為甚麼選擇靈駿

PAI 靈駿智算服務是面向大規模深度學習及融合智算的 PaaS 產品,支持公共雲 Serverless 版和獨享版形態,基於軟硬件一體優化技術,構建高性能異構算力底座,提供 AI 工程化全流程能力,具備高性能、高效率、高利用率等核心優勢,滿足高性能計算等領域需求,可在大模型訓練、自動駕駛、科研、金融等領域廣泛應用。

  • 無服務器 Serverless

    公共雲 Serverless 形態助您一鍵快速拉起 AI 計算任務,借助自動運維輕鬆管理複雜的異構系統,並與阿里雲上的計算、儲存、網絡等各類產品無縫銜接。

  • 高性能 RDMA 網絡

    阿里雲在大型數據中心構建了高性能的 RDMA 網絡,憑藉 800Gbps 的高速低延遲傳輸以及 GPU 直連技術,提高傳輸的穩定性和安全,大幅提升 AI 訓練速度。

  • 高效可靠的 CPFS 儲存系統

    阿里雲的 CPFS 儲存系統採用全並行儲存架構,支持 POSIX/MPI-IO 和 NFS 協議,單叢集支持高達 2TB/s 的數據吞吐量和 3000 萬的 IOPS,為 AI 訓練提供高效可靠的儲存服務。

  • 全面的高性能加速

    自研分佈式訓練加速引擎通過數據集加速、計算加速、優化算法、調度算法和資源優化技術等多種手段,充分釋放算力,全面提升 AI 訓練和推理的速度和效率。

產品組合

PAl 靈駿智算服務 Serverless 版(多租版)

靈駿智算服務 Serverless 版提供靈活且性價比高的選擇。您可按需要購買相關網絡和儲存產品,並根據業務要求一鍵完成擴縮容。 購買計算節點後,無需規劃 CPU 管控節點,實現零成本運維。

  • 核心產品:

  • PAI 靈駿智算 GPU

  • CPFS 儲存系統

PAl 靈駿智算服務獨享版(單租版)

靈駿智算獨享版(單租版)為您建立雲上專屬叢集,讓您的業務獨享專屬的 AI 平台和運維服務,同時利用阿里雲上標準且互通的計算、儲存、網絡等服務,提供便捷的營運管理。

  • 核心產品:

  • PAI 靈駿智算 GPU

  • 靈駿智算連接

  • CPFS 儲存系統

  • ACK 容器服務靈駿版

  • ECS 雲服務器

  • 雲數據庫 RDS

產品功能

新一代 AI 智算平台,滿足大規模 AI 算力需求

企業級 AI 開發平台

提供 AI 開發、訓練等 AI 工程化全流程產品能力,支持多種 AI 角色管理,算力資源管理運維的企業級 AI 平台。

一站式AI計算服務

算力叢集、高性能儲存、容器服務、AI 開發平台的一鍵式開通和全生命週期管理。支持 Serverless 形態,可快速起動 AI 計算任務,運維全面自動化。

易用的分布式計算

大模型訓練只需簡單配置即可自動分佈式並發執行,優化的計算、網絡、通信和儲存架構可提高資源利用率,加快模型訓練速度,讓訓練時間和成本大幅縮減。

叢集管理

通過控制台頁面或 OpenAPI 即可快速的創建叢集,利用豐富的監控指標展示、事件類型以及運行統計,以可視化的方式快速查看運行情況,定位主機和服務異常,並提供從主機、網絡到作業任務的關聯診斷分析工具。方便性能調優和問題溯源。

RDMA網絡

提供高性能的 RDMA 計算網絡、RDMA 儲存網絡和管控網絡,採用高性能和高可用的方式來訪問其它阿里雲服務,具有強安全隔離、分鐘級部署、無級變速、原生高可靠等特點。

高性能儲存

並行 IO 訪問架構,單叢集最高可達 2TB/s 吞吐和 3000 萬 IOPS,支持與雲上和線下儲存數據互通。

應用場景

場景簡介

支持 Serverless 的 AI 研發場景,支持如 Stable Diffusion、Llama 2、OPT 等大模型的訓練,提供深度優化的智能計算服務,可為圖形圖像處理(如 AIGC 圖像生成)、自然語言處理(如 AIGC 文本生成)、語音、視頻等應用場景提供高效、可預期的訓練服務,加速迭代效率。

全局優化、更高效率

  • 超高吞吐和 IOPS

    針對 AI 訓練場景,數據預先加載至持久化儲存,保障訓練時數據加載和寫入的高帶寬需求,提升訓練效率

  • 高資源利用率

    對 GPU 資源進行細粒度切分調度,滿足協同開發,技術經雙十一大規模應用驗證,資源利用率可提升 3 倍

場景簡介

超大規模融合算力,支持深度學習和高性能計算作業統一部署調度,為基礎科研、新藥研發、工程仿真等場景構建統一標準計算服務,促進範式創新、效率提升,促進 AI 與 HPC 開發生態融合。

面向創新的融合式開發

  • 促進科研新範式

    支持雲原生和容器化的 AI 和 HPC 應用生態,為基礎科研、新藥研發、新材料研發等場景提供統一計算服務,支持跨地區、跨團隊協同,提升資源使用率,同時促進技術生態融合,催化協同效應

  • 打造科研大平台

    基於 RDMA 技術和阿里雲高性能通信庫,構建低時延高帶寬網絡環境,針對 AI+HPC 應用進行通信優化,點對點時延可低至 2us,最大可支持數万節點並行計算,為大規模科學計算提供極具效率優勢的智能計算服務

了解由靈駿加速的阿里雲生成式AI解決方案

開通靈駿

1
購買計算節點
聯絡銷售團隊
  • 您可根據業務需要,購買所需機型的計算節點。
  • 1. 登錄智能計算靈駿控制台。
  • 2. 在左側導航欄,選擇資源與節點>節點管理
  • 3. 點擊購買新節點,進入計算節點購買頁面。根據界面提示,選擇節點配置,然後單擊立即購買,根據界面提示完成付款。
2
購買靈駿智算連接
聯絡銷售團隊
  • 1 個叢集當前最多支持使用 1 個靈駿連接實例來對接公共雲環境。
  • 1. 登錄並進入靈駿連接購買頁面。
  • 2. 根據界面提示,選擇智算連接規格,然後單擊立即購買,根據界面提示完成付款。
3
購買 CPFS 儲存
聯絡銷售團隊
  • 阿里雲技術支持人員為您配置完成網絡連通。
  • 1. 訪問 CPFS 儲存購買頁面。
  • 2. 根據界面提示,選擇CPFS規格信息,然後單擊立即購買,根據界面提示完成付款。
  • 說明:CPFS 儲存需要和靈駿處於相同的地域。後續使用過程中,CPFS計費賬單會單獨出賬。

為你提供最優質的服務

1對1售前諮詢、7x24技術服務、更快速的回應、更多的免費支援服務。

1對1售前諮詢

由經驗豐富的雲專家為不同規模企業客戶提供一對一的售前諮詢。了解更多

24/7 技術服務

售後服務時間從每周5天,每天10小時延長到每周7天,每天24小時。了解更多

更好的技術支援

基本售後支援計劃的免費服務數量從每季度3個提升至6個。了解更多

更快的服務回應時間

針對一般指導,阿里雲售後回應時間從36小時縮短至18小時。了解更多
phone 聯絡我們
Hi, I'm Alibaba Cloud AI Assistant!
I can help with questions and solutions.