全部產品
Search
文件中心

Elastic GPU Service:什麼是GPU雲端服務器

更新時間:Mar 13, 2025

GPU雲端服務器提供了GPU加速計算能力,實現GPU計算資源的即開即用和Auto Scaling。作為阿里雲彈性計算家族的一員,其結合了GPU計算力與CPU計算力,滿足您在人工智慧、高效能運算、專業圖形影像處理等情境中的需求,例如,在並行運算方面,使用GPU雲端服務器可顯著提高計算效率。

為什麼選擇GPU雲端服務器

阿里雲GPU雲端服務器是基於GPUCPU應用的計算服務器。GPU在執行複雜的數學和幾何計算方面有著獨特的優勢,特別是在浮點運算、並行運算等方面,GPU可以提供比CPU高百倍的計算能力。GPU的功能特性如下:

  • 擁有大量擅長處理大規模並發計算的算數邏輯單位(Arithmetic and Logic Unit,即ALU)。

  • 能夠支援多線程並行的高輸送量運算。

  • 邏輯控制單元相對簡單。

下表為您介紹GPU雲端服務器與自建GPU伺服器的區別。

對比項

GPU雲端服務器

GPU自建伺服器

靈活性

  • 能夠快速開通一台或多台GPU雲端服務器執行個體。

  • 執行個體規格(vCPU、記憶體及GPU)支援靈活變更,並且支援線上升降配。

  • 頻寬升降自由。

  • 伺服器購買周期長。

  • 伺服器規格固定,無法靈活變更。

  • 頻寬一次性購買,無法自由升降。

易用性

  • Web線上管理,簡單方便。

  • 內建主流的作業系統,Windows正版啟用,且支援線上更換作業系統。

  • GPU驅動可以在購買時一併安裝,方便快捷。

  • 沒有線上管理工具,維護困難。

  • 需使用者自備作業系統,自行安裝及更換。

  • GPU驅動需要自行購買安裝。

容災備份

  • 三副本資料設計,單份損壞可在短時間內快速恢複。

  • 硬體故障事故中可快速自動回復。

  • 使用者自行搭建,使用普通存放裝置,價格高昂。

  • 資料損毀需使用者修複。

安全性

  • 能夠有效阻止MAC欺騙和ARP攻擊。

  • 並防護DDoS攻擊,可進行流量清洗和黑洞。

  • 享有連接埠入侵掃描、掛馬掃描、漏洞掃描等附加服務。

  • 很難阻止MAC欺騙和ARP攻擊。

  • 清洗和黑洞裝置需要另外購買,價格昂貴。

  • 普遍存在漏洞掛馬和連接埠掃描等問題。

成本

  • 支援訂用帳戶及隨用隨付兩種購買方式,可靈活選擇適合您業務情境的付費方式。

  • 按需購買,無需一次性大量投入。

  • 無法按需購買,必須為業務峰值滿配。

  • 一次性投入巨大,閑置浪費嚴重。

GPU執行個體規格類型系列

執行個體是能夠為您的業務提供計算服務的最小單位,不同的執行個體規格可以提供的計算能力也不同。根據業務情境和使用情境,ECS執行個體可以分為多種執行個體規格類型系列。GPU執行個體屬於ECS執行個體中的一類執行個體規格,GPU執行個體在提供GPU加速能力的同時,保留了與普通ECS執行個體一致的使用體驗。在建立ECS執行個體時,請選擇企業級異構運算規格類型系列、ECS Bare Metal Instance和Super Computing Cluster(SCC)執行個體規格類型系列下的GPU執行個體規格即可。

關於GPU執行個體規格的更多資訊,請參見執行個體規格類型系列

產品優勢

  • 覆蓋範圍廣闊

    阿里雲GPU雲端服務器在全球多個地區實現規模部署,覆蓋範圍廣,結合彈性供應、Auto Scaling等交付方式,能夠很好地滿足您業務的突發需求。

  • 計算能力超強

    阿里雲GPU雲端服務器配備業界超強算力的GPU計算卡,結合高效能CPU平台,單一實例可提供高達1000 TFLOPS的混合精度計算效能。

  • 網路效能出色

    阿里雲GPU雲端服務器執行個體的VPC網路最大支援450萬的PPS及32 Gbit/s的內網頻寬。在此基礎上,Super Computing Cluster產品中,節點間額外提供高達50 Gbit/s的RDMA網路,滿足節點間資料轉送的低延時高頻寬要求。

  • 購買方式靈活

    支援靈活的資源付費模式,包括訂用帳戶、隨用隨付、搶佔式執行個體、預留執行個體券、儲存容量單位包。您可以按需要購買,避免資源浪費。

同時,阿里雲也提供了神行工具包搭配GPU雲端服務器一起使用,神行工具包具有GPU計算服務增強能力,可以協助您更方便、更高效地使用阿里雲的雲上GPU資源。更多資訊,請參見神行工具包優勢

產品計費

GPU雲端服務器的計費相關功能和Elastic Compute Service一致,其中,計算資源(vCPU、記憶體以及GPU)、鏡像、Block Storage、公網頻寬以及快照等資源涉及計費。

常見的計費方式如下所示:

  • 訂用帳戶:按一定時間長度購買資源,先付費後使用。

  • 隨用隨付:按需開通和釋放資源,先使用後付費。

  • 搶佔式執行個體:通過競價模式搶佔庫存充足的計算資源,相對隨用隨付執行個體有一定的折扣,但是存在回收機制。

  • 預留執行個體券:搭配隨用隨付執行個體使用的抵扣券,承諾使用指定配置的執行個體(包括執行個體規格、地區和可用性區域等),以折扣價抵扣計算資源的賬單。

  • 節省計劃:搭配隨用隨付執行個體使用的折扣權益計劃,承諾使用穩定數量的資源(以元/小時為單位衡量),以折扣價抵扣計算資源、系統硬碟等資源的賬單。

  • 儲存容量單位包:搭配隨用隨付儲存產品使用的資源套件,承諾使用指定容量的儲存資源,以折扣價抵扣Block Storage、NAS、OSS等資源的賬單。

關於GPU雲端服務器計費的更多介紹,請參見GPU雲端服務器計費

關聯工具包

阿里雲提供神行工具包供您更高效地使用GPU資源,神行工具包中的組件主要包括以下工具:

說明

關於神行工具包的更多資訊,請參見什麼是神行工具包(DeepGPU)

工具名稱

說明

GPU容器共用技術cGPU

阿里雲基於核心虛擬GPU隔離的容器共用技術,隔離GPU資源,實現多個容器共用一張顯卡。

叢集極速部署工具FastGPU

阿里雲推出的人工智慧計算任務構建工具,提供便捷的介面和命令列,供您在阿里雲IaaS資源上構建人工智慧計算任務。