全部產品
Search
文件中心

Elastic Compute Service:ECS選型最佳實務

更新時間:Jun 19, 2024

購買ECS執行個體之前,您需要結合效能、價格、工作負載等因素,做出性價比與穩定性最優的決策。本文主要介紹如何結合實際業務情境選購阿里雲Elastic Compute Service。

重要

本文主要介紹如何選擇企業級執行個體規格類型系列,不包括入門級(共用型)規格類型系列。有關入門級執行個體選型,請參見共用型突發效能執行個體概述

瞭解執行個體規格類型系列

  • 執行個體規格清單:執行個體規格類型系列

  • 執行個體規格類型系列分類說明

    企業級?共用型?ECS Bare Metal Instance?高效能運算?異構計算?

    • 企業級執行個體是阿里雲2016年9月開始推出的一系列執行個體規格類型系列的總稱,具有高效能、穩定計算能力和平衡網路效能的特點。因為具有獨享且穩定的計算、儲存、網路資源,這些執行個體規格類型系列非常適合對業務穩定性具有高要求的企業情境。

    • 共用型執行個體是一系列面向一般中小網站或個人開發人員的執行個體規格(族)總稱。與企業級執行個體相比,共用型執行個體在資源利用上更多強調資源效能的共用,所以無法保證執行個體計算效能的穩定,但成本相對來說也更低。

    • ECS Bare Metal Instance融合了物理機與雲端服務器的優勢,實現超強超穩的計算能力。通過阿里雲自主研發的虛擬化2.0技術,您的業務應用可以直接存取ECS Bare Metal Instance的處理器和記憶體,無任何虛擬化開銷。ECS Bare Metal Instance具備物理機層級的完整處理器特性(例如Intel VT-x),以及物理機層級的資源隔離優勢,特別適合上雲部署傳統非虛擬化情境的應用。

    • 高效能運算將計算能力積聚,用並行計算方式解決更大規模的科學、工程和商業問題。

    • 異構計算(Heterogeneous Computing)是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式,能夠讓最適合的專用硬體去服務最適合的業務情境,在特定情境下,異構計算產品比普通的雲端服務器高出一個甚至更多數量級的性價比和效率。

  • 執行個體規格命名規則

    執行個體規格類型系列名稱格式為ecs.<規格類型系列>,執行個體規格名稱為ecs.<規格類型系列>.<nx>large。具體命名規則說明如下所示:

    • ecs:Elastic Compute Service的產品代號。

    • <規格類型系列>:由規格類型系列主體+規格類型系列尾碼組成。

      說明

      以下樣本僅展示執行個體規格類型系列的部分常見規格的名稱含義。

      • x86運算規格類型系列和ARM運算規格類型系列

        命名組成

        說明

        命名樣本含義

        規格類型系列主體

        由小寫字母+數字組成。

        • 小寫字母:為某個單詞的縮寫,標誌著執行個體規格類型系列的效能領域。

        • 數字:一般用於區別同類型規格類型系列間的發布時間。

          更大的數字代表新一代規格類型系列,擁有更高的性價比,價格低效能好。

        • c:表示計算型(computational)

          處理器與記憶體配比為1:2,適用於資料庫、Web伺服器、高效能科學和工程應用、遊戲服、資料分析、批次運算、視頻編碼、機器學習等情境。

        • g:表示通用型(general)

          處理器與記憶體配比為1:4,適用於通用互連網應用、資料庫、Web網站、Java應用服務、遊戲服務、搜尋推廣、安全可信計算等情境。

        • u:表示通用算力型(universal)

          處理器與記憶體配比為1:1、1:2、1:4、1:8,適用於對價格敏感的企業級客戶,主要應用於中小型和規模的企業級應用、網站和應用伺服器,中小型資料庫系統、緩衝、搜尋叢集等情境。

        • r:表示記憶體型(ram)

          處理器與記憶體配比為1:8(部分規格不為1:8),適用於記憶體資料庫、資料分析與挖掘、分布式記憶體緩衝(Redis)、巨量資料類應用(Kafka、Elasticsearch等),以及對記憶體容量要求較高的通用企業級應用(Java)等情境。

        • re:表示記憶體增強型(ram enhanced)

        • hf(c/g/r):表示高主頻型(high frequency)

          處理器與記憶體配比為1:2、1:4、1:8,適用於大型多人線上遊戲、HPC等高效能科學計算情境,中大型資料庫系統等。

        • i:表示本地SSD型(instance family with local SSDs)

          處理器與記憶體配比為1:4、1:8,適用於OLTP、高效能關係型資料庫、NoSQL資料庫(例如Cassandra、MongoDB等)、Elasticsearch等搜尋情境、EMR巨量資料存算分離情境。

        • d:表示巨量資料型(big data)

          處理器與記憶體配比為1:4,適用於Hadoop MapReduce、HDFS、Hive、HBase等巨量資料計算和儲存業務情境,Elasticsearch、Kafka等搜尋和日誌資料處理情境。

        • s:表示共用型(share)

        • t:表示突髮型(burst)

        • e:表示經濟型(economy)

        例如,ecs.g6.2xlarge表示通用型g6規格類型系列中的一個執行個體規格,擁有8個vCPU核。相比於g5規格類型系列,g6為新一代通用型執行個體規格類型系列。

        規格類型系列尾碼

        由小寫字母組成。

        • y:表示採用阿里雲自研倚天710 ARM架構CPU(Yitian)

        • a:表示採用AMD CPU

        • ae:表示AMD增強型(AMD enhanced)

        • i:表示採用intel CPU

        • h:表示採用海光處理器

        • re:表示RDMA增強型(RDMA enhanced)

        • se:表示儲存增強型(storage enhanced)

        • ne:表示網路增強型(network enhanced)

        • t:表示安全增強型(tpm)

        • p:表示持久記憶體型(persistent ram)

      • 異構運算規格類型系列、ECS Bare Metal Instance、Super Computing Cluster(SCC)執行個體規格類型系列

        異構運算規格類型系列、ECS Bare Metal Instance和Super Computing Cluster(SCC)執行個體規格類型系列一般採用自主命名方式,由小寫字母和數字混合組成。

        命名組成

        說明

        命名樣本含義

        規格類型系列主體

        由小寫字母組成。

        • gn:表示搭載NVIDIA GPU的計算型執行個體

        • vgn:表示採用NVIDIA GRID vGPU加速的獨享型執行個體

        • sgn:表示採用NVIDIA GRID vGPU加速的共用型執行個體

        • gi:表示搭載Intel GPU的計算型執行個體

        • f:表示FPGA計算型執行個體

        • ebm(c/g/r/gn/hf):表示ECS Bare Metal Instance(elastic bare metal)

        • scc(c/g/h/gn/hf):表示Super Computing Cluster(super computing cluster)

        規格類型系列尾碼

        由數字或小寫字母+數字組成。

        • 6v:6表示採用Volta/Turing架構;v表示GPU類型為V100且GPU顯存為16 GB。

          例如,gn6v表示採用Volta/Turing架構,顯存為16 GB,且搭載NVIDIA V100 GPU的計算型執行個體。

        • 6e:6表示採用Volta/Turing架構;e(extend)表示第2代GPU類型為V100且顯存為32 GB。

          例如,gn6e表示採用Volta/Turing架構,顯存為32 GB,且搭載NVIDIA V100 GPU的計算型執行個體。

        • 6i:6表示採用Volta/Turing架構;i(inference)表示GPU類型為T4。

          例如,gn6i表示採用Volta/Turing架構且搭載NVIDIA的T4 GPU計算型執行個體。

        • 6s:6表示採用Volta/Turing架構;s表示第6代SG-1。

          例如,ebmgi6s表示採用Intel®Server GPU卡和第6代SG-1晶片的視覺計算型執行個體。

        • 7:表示採用Ampere架構。

        • 7i:7表示採用Ampere架構;i(inference)表示GPU類型為A10且顯存為24 GB。

        • 7e:7表示採用Ampere架構。

        • 7s:7表示採用Ampere架構;s表示用於第7代A30 GPU。

    • <nx>large:large表示vCPU核心數,<nx>中的n越大,表示vCPU核心數越多。其中,xlarge代表4核,2xlarge代表8核,3xlarge代表12核等等,以此類推。

  • 支援變更配置的執行個體規格:請參見支援變更配置的執行個體規格

  • 查看執行個體可購買地區:各個地區下可供售賣的執行個體規格可能存在差異,執行個體的可購情況,您可以前往ECS執行個體可購買地區查看。

執行個體適用情境

企業級執行個體

GPU&異構執行個體

根據應用情境選型

根據您使用的應用,並參考選型原則,選擇對應的執行個體規格類型系列。

應用類型

常用應用

選型原則

推薦執行個體規格類型系列

負載平衡

Nginx

應用特點:需要支援高頻率的建立串連操作。

  • CPU計算能力:要求較高。

  • 記憶體:要求不高。

c8i、c7、c7nex、g5ne

RPC產品

  • SOFA

  • Dubbo

應用特點:網路連結密集型;進程運行時需要消耗較高的記憶體。

g8a、g7nex、g8i、g7

緩衝

  • Redis

  • Memcache

  • Solo

  • CPU計算能力:要求不高。

  • 記憶體:要求較高。

r8i、r8a、r7、r7a

配置中心

ZooKeeper

在應用啟動協商時會有大量I/O讀寫操作。

  • CPU計算能力:要求不高。

  • 記憶體:要求不高。

c8a、c7、c8i、u1

訊息佇列

  • Kafka

  • RabbitMQ

從訊息完整性方面考慮,儲存優先選用雲端硬碟。

  • CPU計算能力:要求不高。

  • 記憶體和vCPU配比通常為1:1。

  • 儲存:要求不高。

c8a、c7、c8i、u1

容器編排

Kubernetes

通過ECS Bare Metal Instance和容器的組合,可以最大限度地挖掘計算潛能。

ebmc6e、ebmg6e、ebmc6、ebmg6、ebmc6a、ebmc7a、ebmg6a、ebmg7a系列

大表格儲存體

HBase

  • 一般可以選擇d系列。

  • 如果業務存在超高IOPS(Input/Output Operations Per Second)需求,可以選擇i系列。

d3c、d3s、i4

資料庫

  • MySQL

  • NoSQL

  • 對於儲存有彈性擴充的需求,可以選擇ECS和ESSD。

  • 對於I/O敏感型業務的需求,優先選擇i系列。

g8a、g7、g8i、i4,

SQLServer

  • 由於Windows的I/O單通道特性,對I/O讀寫能力要求較高,優先選擇ESSD。

  • ECS的邏輯和物理扇區設定為4 K。

g8a、g7、r7、r8i、g8i

文本搜尋

Elasticsearch

  • 選用記憶體與vCPU配比較大的ECS規格。

  • 日常需要將資料庫資料匯出成ES檔案,對I/O讀寫有要求。

i4、i4r、i3、i2

Realtime Compute

  • Flink

  • Blink

基於儲存量可以選擇ECS通用規格和雲端硬碟,也可以選擇d系列。

i4g、i4、d3c

離線計算

  • Hadoop

  • HDFS

  • CDH

優先選擇d系列。

d3s、d3c

視頻轉碼

  • 點播

  • 直播

  • CPU計算能力:要求高

  • 記憶體:要求不高

  • IO:要求不高

c8y

巨量資料

  • Spark

  • Hive

  • CPU計算能力:要求高

  • 記憶體:記憶體頻寬要求高

  • IO:儲存頻寬要求高

g8y、r8y

跨平台 app、遊戲服務、ApsaraVideo for Live情境推薦

在該類情境中,效能需求表現為CPU計算密集型,您需要相對均衡的處理器與記憶體資源配比,通常選用CPU與記憶體配比1:2、系統硬碟選用高效雲端硬碟、資料盤選用SSD雲端硬碟或者ESSD雲端硬碟。如果業務需要更強的網路效能,如視頻彈幕等,您可以選用同系列中更高規格的執行個體規格,提高網路收發包能力(PPS)。

情境分類

情境細分

推薦規格類型系列

效能需求

處理器與記憶體比

跨平台 app

均衡效能應用,後台應用

g系列,如g7

中主頻,計算密集型

1:4

高網路收發包應用

g系列,如g7

高網路PPS,計算密集型

1:4

高效能運算

hfc系列,如hfc7

高主頻,計算密集型

1:2

遊戲應用

高效能端遊

hfc系列,如hfc7

高主頻

1:2

手遊、頁遊

g系列,如g6e

中主頻

1:4

ApsaraVideo for Live

視頻轉寄

g系列,如g7

中主頻,計算密集型

1:4

直播彈幕

g系列,如g7

高網路PPS,計算密集型

1:4

Hadoop、Spark、Kafka巨量資料情境推薦

在該類情境中,由於涉及不同的節點,效能需求表現較為複雜,您需要均衡各個節點的效能表現,包括計算、儲存吞吐、網路效能等。

  • 管理節點:當作通用情境處理,請參見跨平台 app、遊戲服務、ApsaraVideo for Live情境推薦

  • 計算節點:當作通用情境處理,請參見跨平台 app、遊戲服務、ApsaraVideo for Live情境推薦。根據叢集規模的不同,需要選擇的執行個體規格不同。例如100個節點以下可以選用ecs.g7.4xlage,100個節點以上可以選用ecs.g7.8xlage。

  • 緩衝節點:用於儲存熱資料或部署RSS,側重磁碟和網路IO效能,推薦使用i4g、i2g。

  • 計算緩衝節點:用於計算和緩衝,兼備計算效能和IO效能、磁碟容量,推薦使用i4、i4r、d3c。

    說明

    計算節點在計費模式上可以採用搶佔式執行個體,實現性價比最佳化。更多資訊,請參見什麼是搶佔式執行個體

  • 資料節點:需要高儲存吞吐、高網路吞吐、均衡的處理器與記憶體配比,推薦您使用巨量資料型d系列規格類型系列。例如MapReduce/Hive可選擇ecs.d2s.5xlarge、ecs.d3s.4xlarge等,Spark/Mlib可選擇ecs.d2s.10xlarge。

資料庫、緩衝、搜尋情境推薦

在該類情境中,執行個體規格的處理器與記憶體配比一般要求高於1:4,部分軟體對儲存I/O讀寫能力及時延效能較為敏感,建議您選用單位記憶體性價比較高的規格類型系列。

情境分類

情境細分

推薦規格類型系列

處理器與記憶體比

資料盤

關係型資料庫

高效能,依賴應用程式層高可用

i系列

1:4

本地SSD儲存、高效雲端硬碟、SSD雲端硬碟

中小型資料庫

g系列,或其他記憶體佔比為1:4的規格類型系列

1:4

高效雲端硬碟、SSD雲端硬碟

高效能資料庫

i、r系列

1:8

高效雲端硬碟、SSD雲端硬碟

分布式緩衝

中記憶體消耗情境

g系列,或其他記憶體佔比為1:4的規格類型系列

1:4

高效雲端硬碟、SSD雲端硬碟

高記憶體消耗情境

r系列、i系列

1:8

高效雲端硬碟、SSD雲端硬碟

NoSQL資料庫

高效能,應用程式層高可用

i系列

1:4

本地SSD儲存、高效雲端硬碟、SSD雲端硬碟

中小型資料庫

g系列,或其他記憶體佔比為1:4的規格類型系列

1:4

高效雲端硬碟、SSD雲端硬碟

高效能資料庫

i4、i4r系列

1:8

高效雲端硬碟、SSD雲端硬碟、本地SSD儲存

Elasticsearch

小叢集,靠雲端硬碟保證資料高可用

g系列,或其他記憶體佔比為1:4的規格類型系列

1:4

高效雲端硬碟、SSD雲端硬碟

大叢集,高可用

d系列

1:4

本地SSD儲存、高效雲端硬碟、SSD雲端硬碟

以資料庫為例,在傳統方式中,業務系統直接對接OLTP資料庫,資料冗餘大多通過RAID磁碟陣列實現。選擇Elastic Compute Service,您的輕載、重載資料庫都能實現靈活部署。

  • 輕載資料庫:採用i4r、i4g系列執行個體搭配雲端硬碟使用,性價比更高。

  • 重載資料庫:需要高儲存IOPS和低讀寫延時,推薦您使用本地SSD型i系列執行個體規格類型系列(搭配了高I/O型本地NVMeSSD本地碟),滿足大型重載資料庫的要求。

資料庫選型

深度學習、影像處理情境推薦

在該類情境中,應用需要高效能的GPU加速器,在GPU和CPU配比方面有如下建議。

  • 深度學習訓練:GPU與CPU比例推薦為1:8到1:12之間。

  • 通用深度學習:GPU與CPU比例推薦為1:4到1:48之間。

  • Image Recognition推理:GPU與CPU比例推薦為1:4到1:12之間。

  • 語音辨識與合成推理:GPU與CPU比例推薦為1:16到1:48之間。

常見情境的GPU選型推薦如下圖所示。GPU選型

驗證與調整

當您完成選型並開始使用Elastic Compute Service執行個體後,建議您根據一段時間的效能監控資訊,驗證所選執行個體規格是否合適。

假設您選擇了ecs.g7e.xlarge,通過監控發現執行個體CPU使用率一直較低,建議您登入執行個體檢查記憶體佔用率是否較高,如果記憶體佔用較高,您可以調整為處理器與記憶體資源配比更合適的規格類型系列。更多資訊,請參見以下文檔:

使用Elastic Compute Service的過程中,如果發生地區庫存不足、執行個體規格類型系列停售、修改為更高性價比規格類型系列、升級配置等情況,您可以根據執行個體規格類型系列的特點進行變更配置。更多資訊,請參見升降配方式概述支援變更配置的執行個體規格