全部產品
Search
文件中心

Elastic GPU Service:基本概念

更新時間:Jan 23, 2025

本文匯總使用GPU雲端服務器過程中涉及的基本概念,方便您查詢和瞭解相關概念。

GPU雲端服務器相關概念

概念

說明

GPU

圖形處理器(Graphics Processing Unit)。相比CPU具有眾多計算單元和更多的流水線,適合用於大規模並行計算等情境。

CUDA

NVIDIA推出的通用並行計算架構,協助您使用NVIDIA GPU解決複雜的計算問題。

cuDNN

NVIDIA推出的用於深度神經網路的GPU加速庫。

DeepGPU

阿里雲專門為GPU雲端服務器搭配的具有GPU計算服務增強能力的免費工具集合。

FastGPU

阿里雲推出的人工智慧計算任務構建工具。提供便捷的介面和命令列,供您在阿里雲IaaS資源上構建人工智慧計算任務。

cGPU

阿里雲基於核心虛擬GPU隔離的容器共用技術。隔離GPU資源,實現多個容器共用一張顯卡。

ECS通用概念

概念

說明

ECS執行個體

雲上的虛擬計算服務器,內含vCPU、記憶體、作業系統、網路、磁碟等基礎組件。

ECS執行個體規格

定義了ECS執行個體在計算效能、儲存效能、網路效能等方面的基本屬性,但需要同時配合鏡像、Block Storage、網路等配置才能確定一台ECS執行個體的具體服務形態。

鏡像

提供了運行執行個體所需的資訊,包括作業系統、初始化應用資料等。

公用鏡像

阿里雲官方提供的基礎鏡像,均已獲得正版授權,涵蓋Windows Server系統鏡像和主流的Linux系統鏡像。

Alibaba Cloud Linux

阿里雲官方作業系統,為雲上應用程式提供安全、穩定、高效能的定製化運行環境,並進行了針對性的深度最佳化,更加適合阿里雲基礎設施。

自訂鏡像

您自行建立或匯入的鏡像,包含了初始系統內容、應用環境、軟體配置等資訊,可以節省重複配置的時間。

Block Storage

高效能、低時延的塊裝置,像物理硬碟一樣分區格式化並建立檔案系統後使用,滿足大部分通用業務情境下的資料存放區需求。

雲端硬碟

資料區塊層級的Block Storage產品,採用分布式三副本機制,為ECS執行個體提供99.9999999%的資料可靠性保證。

本地碟

ECS執行個體所在物理機上的本地硬碟裝置,儲存I/O效能、海量儲存的性價比極高,但資料可靠性取決於物理機的可靠性,存在單點故障風險。

快照

某一時間點雲端硬碟資料狀態的備份檔案,用於備份或者恢複整個雲端硬碟。

安全性群組

一種虛擬防火牆,您可以基於安全性群組控制執行個體的入流量和出流量。

SSH金鑰組

一種安全便捷的登入認證方式,由公開金鑰和私密金鑰組成,僅支援Linux執行個體。

執行個體RAM角色

ECS執行個體通過執行個體RAM角色獲得該角色擁有的許可權,可以基於臨時安全性權杖STS(Security Token Service)訪問指定雲端服務的API和操作指定的雲資源,安全性更高。

專用網路

您基於阿里雲建立的自訂私人網路,不同專用網路之間通過隧道在邏輯上徹底隔離。您可以完全掌控自己的專用網路,例如選擇IP位址範圍、配置路由表和網關等。

彈性網卡

一種獨立的虛擬網卡,可以綁定到ECS執行個體或從ECS執行個體解除綁定,實現業務的靈活擴充和遷移。

執行個體啟動模板

包含了ECS執行個體的配置資訊,使用執行個體啟動模板建立ECS執行個體可以免去重複配置的操作。

部署集

部署集支援高可用策略,部署集內執行個體會嚴格分散在不同的物理伺服器上,保證業務的高可用性和底層容災能力。

Dedicated Host

一台由單租戶獨享實體資源的雲主機,具有滿足嚴格的安全合規要求、允許自備授權證(BYOL)上雲等優勢。

彈性供應組

用於快速部署多可用性區域、多執行個體規格的ECS執行個體叢集,通過多種供應策略組合使用搶佔式執行個體和隨用隨付執行個體,滿足對低成本和高穩定性的要求。

標籤

由一對索引值(Key-Value)組成。使用標籤標識具有相同特徵的資源後,例如所屬組織或用途相同的資源,您可以基於標籤方便地檢索和管理資源。

資源群組

供您從業務角度管理跨地區、跨產品的資源,並支援針對資源群組的許可權管理。

雲助手

阿里雲提供的自動化營運工具,無需登入即可完成在ECS執行個體上執行命令、向ECS執行個體傳送檔案等操作。

系統事件

影響ECS執行個體運行狀態的計劃底層營運事件或非預期維修事件,需要進行重啟、停止或釋放ECS執行個體等操作。系統事件會及時發送通知、應對措施和事件周期等資訊,方便您提前完成備份資料等準備工作。