作為企業IT成本管理員,如果您需要多維度瞭解叢集資源使用量及成本分布,擷取成本節約建議,從而提升叢集資源使用率,您可以啟用ACK叢集提供的成本洞察功能。啟用後,您可以查看指定財務治理周期內,指定叢集、部門、應用的成本和資源使用方式,滿足多種情境的成本估算、分攤與核算的需求。
前提條件
已經完成阿里雲Container Service ACK 接入CloudMonitor2.0。
為什麼使用成本洞察
通過雲原生技術進行IT資訊化轉型是很多企業進行中的變革,IT成本最佳化是公司資訊化轉型的重要目標。您可以通過使用雲原生技術的共用、隔離、彈性等能力,非常簡單地進行成本最佳化。相比基於傳統的容量規劃的IT成本管理方式,雲原生的IT成本管理會帶來更大的挑戰。典型問題如下:
如何準確地統計ACK叢集的費用
如何更準確地估算一個Pod的費用
如何更準確地估算線上應用或離線作業的費用
如何通過命名空間(部門)來分攤ACK叢集管理費用
如何通過可視化的方式發現叢集中的成本浪費並進行最佳化
圖 1. 不同叢集利用率
為瞭解決這些問題,ACK提供了成本洞察功能。成本洞察是FinOps(Finance+DevOps,是企業管理和最佳化雲成本的一種方案)的重要環節,貫穿了整個成本治理流程,例如日常的成本趨勢檢查、成本異常時的問題分析、實施最佳化手段後的效果評估等。
成本洞察大盤的維度

維度 | 說明 |
CS Cost Overview | 對叢集整體資源和成本情況的洞察,能夠反映叢集成本的整體健康情況。對於一個叢集,首先需要關注整個叢集的費用趨勢變化,以判斷成本是否符合預期。在叢集成本變化呈現非正常趨勢時,您可以結合大盤資料進一步排查根本原因。 |
CS Cost Namespace | 如果您的企業以命名空間維度劃分部門或業務,您可以篩選命名空間,查看指定命名空間的資源和成本資訊。 |
CS Cost Node Pool | 叢集資源維度成本情況的洞察。以ECS為主的計算資源往往是叢集費用的主要組成部分,也是IT營運人員最直接管理的資源。節點池成本洞察能夠為您提供節點池資源流量分析和付費策略的選擇。 |
CS Cost Application | 側重於情境化的成本最佳化。您可以使用Label萬用字元(Label Selector)篩選出指定應用,進行成本和資源的統計。基於Label Selector,您不僅可以監控單個應用的成本和資源用量,還可以監控多個相關應用。 例如,在巨量資料工作流程的情境下,您可以為流程中的所有應用加相同的Label,從而對整個工作流程業務進行成本分析。 |
功能入口
登入CloudMonitor2.0控制台,選擇目標工作空間,在左側導覽列選擇。
在容器洞察的導覽列,選擇。
在右側可視化大盤頁面,單擊不同頁簽,查看成本可視化大盤。
CS Cost Overview
CS Cost Namespace
CS Cost Node Pool
CS Cost Application
CS Cost Overview 叢集維度成本分析
篩選維度
參數選項 | 描述 |
叢集賬單成本 | 叢集成本統計指標選項,包含優惠後實際賬單成本和原價賬單成本統計:
關於應付金額和官網價的詳細介紹,請參見明細賬單(已下線重新導向)。 說明 叢集中應用部分成本統計只會按原價賬單成本進行統計,包括Namespace、Pod等應用維度成本統計。 |
成本分攤模型 | 成本分攤模型選項,包含單資源模型和權重混合資源模型,具體分為如下幾類。
關於成本分攤模型選擇的詳細介紹,請參見成本估算策略介紹。 |
時間範圍 | 選擇大盤時間範圍,您可以設定該項查看不同時間範圍的成本、資源趨勢。 |
叢集成本概覽
指標 | 描述 |
| 這裡的展示的資料結果與您選擇的成本分攤模型選項有關。大盤預設CPU模型選項,使用CPU資源請求量估算Pod成本。 |
| 成本費用統計,其中昨日叢集花費、花費日環比、本周累計花費和本月累計花費為本叢集的雲資源的賬單成本統計。 本周累計、本月累計花費分別為自然周、自然月的賬單花費統計。由於賬單出賬周期存在T+1延遲,周一將不顯示本周累計花費資料,每月第一日也將不顯示本月累計花費的統計值。 花費日環比為昨日叢集成本與前一天之間的環比:
|
叢集花費&叢集容量趨勢圖 | 叢集花費和叢集容量趨勢圖,黃色曲線表示成本消費,藍色曲線表示實際的叢集容量。通常情況下,兩條曲線會存在一定的相關性。 對比兩者相關性,如果發現兩者呈現趨勢不一致,表明叢集的單位核成本異常。請檢查是否有資源花費過高。 |
|
說明
|
穩定性&效率分析
指標 | 描述 |
| 展示叢集中各種QoS的Pod數量以及總資源用量。 |
叢集Pod資源使用率分析 | 提供叢集所有Pod的基礎資訊和資源使用率(Usage/Request),同時支援過濾和排序。您可以通過該功能批量查看叢集中資源水位最高或最低的工作負載。 |
Burstable Pod - 資源用量分析 | 查看QoS類為Burstable Pod的資源配置情況,同時支援過濾和排序。您可以通過該功能查看每個Burstable Pod的CPU、記憶體等資源的請求(Request)和限制(Limit)情況,便於您瞭解Pod所消耗的叢集資源並識別潛在的資源瓶頸。 |
Best Effort Pod - 資源用量分析 | 查看QoS類為BestEffort Pod的資源配置情況,這類Pod一般具有較高穩定性風險,您可以通過過濾和排序列表,來檢查是否有預期外的BestEffort Pod,以便及時處理來規避風險。 |
關於穩定性&效率分析功能的更多資訊,請參見使用成本洞察識別叢集資源風險。
叢集費用分析
指標 | 描述 |
| 一個叢集中會包含多種雲產品,不同雲產品的使用方式、計費模型不同,會導致雲產品產生的費用存在差異。您可以通過成本趨勢和組合查看不同的雲產品消費情況,從而進行成本決策。 |
實際花費趨勢(叢集維度) | 每日叢集的總費用成本趨勢統計。 |
實際花費趨勢(節點池維度) | 叢集中各節點池或虛擬節點(Virtual Node)的節點賬單成本分析。 |
花費估算分析(命名空間維度) - 原價賬單成本 |
|
叢集計算資源的請求&使用率趨勢圖 | 使用情境:
趨勢圖含義:
應用已指派且未使用資源=綠色柱狀圖-黃色柱狀圖 叢集剩餘資源可分配量=Y軸-綠色柱狀圖 分析流程:
|
| 雲產品維度、雲產品執行個體維度叢集每日賬單列表。 |
CS Cost Namespace 命名空間維度成本分析
命名空間大盤能夠通過命名空間篩選、展示各命名空間的資源和成本資訊。命名空間常對應於公司的部門或團隊。
篩選維度
參數選項 | 描述 |
命名空間(Namespace) | 選擇分析的叢集的命名空間,預設為ALL,即整個叢集。 |
成本分攤模型 | 成本分攤模型選項,包含單資源模型和權重混合資源模型,具體分為如下幾類。
關於成本分攤模型選擇的詳細介紹,請參見成本估算策略介紹。 |
實際/原價賬單 | 叢集成本統計指標選項,包含優惠後實際賬單成本和原價賬單成本統計:
關於應付金額和官網價的詳細介紹,請參見明細賬單(已下線重新導向)。 |
時間範圍 | 選擇大盤時間範圍,預設為最近7天。您可以設定該項查看不同時間範圍的成本、資源趨勢。 |
費用概覽
指標 | 描述 |
| 您可以通過CPU、記憶體指標判斷命名空間資源浪費情況。指標含義如下:
|
命名空間即時成本估算 | 命名空間的即時估算成本,是命名空間內所有Pod估算成本之和。 |
命名空間費用分攤 | 命名空間的費用分攤值,是命名空間按估算比例對叢集實際費用的分攤。 |
成本明細及趨勢
指標 | 描述 |
每核時單價 | Pod所在的節點的CPU每核每小時的單價趨勢統計。 |
CPU/記憶體 資源使用率趨勢 | 命名空間下CPU和記憶體資源使用率趨勢統計。 |
| 資源分派情況和真實消耗情況的趨勢,藍色曲線表示已指派的資源,紅色曲線表示真實消耗的資源。 Pod調度時,節點會為Pod預分配一定的資源,但容器進程真實消耗的資源通常與預分配資源不一致。③能反映出二者間的關係,從而供您進行浪費資源的最佳化。 |
|
|
Pod資源請求量排行 | 統計分析叢集中Pod資源請求量大的應用,用於容量規劃等情境。 |
Pod資源使用率排行 - 按CPU使用率排序 | 查看資源使用率低的Pod應用副本,供您查看閑置應用。 |
Pod資源閑置排行 |
|
CS Cost Node Pool 節點池維度成本分析
節點池大盤提供了叢集資源維度成本洞察,能夠為您提供節點池資源流量分析和付費策略的選擇。
節點池側重資源的維度,站在不同節點池的視角進行資源成本的規劃與治理。例如GPU節點池這類資源可能分屬多個部門,難以通過命名空間維度分析成本,而通過節點池可以直接從資源維度設定策略,進行成本最佳化。
篩選維度
參數選項 | 描述 |
實際/原價賬單 | 叢集成本統計指標選項,包含優惠後實際賬單成本和原價賬單成本統計:
關於應付金額和官網價的詳細介紹,請參見明細賬單(已下線重新導向)。 |
節點池ID(NodePoolID) | 選擇分析的叢集的節點池,預設為All,即所有節點池。 |
時間範圍 | 選擇大盤時間範圍,預設為最近7天。您可以設定該項查看不同時間範圍的成本、資源趨勢。 |
費用概覽
指標 | 描述 |
|
|
叢集每核時的單價 | 一段時間內節點池中節點每核時的單價費用變化的趨勢。 |
| 節點池中節點的花費成本變化趨勢,以及該節點池節點佔總叢集費用比例的變化趨勢。 |
付費策略及花費預估
指標 | 描述 |
| 一段時間內不同付費售賣策略節點執行個體數的佔比分析和變化趨勢,以及節點池節點不同售賣策略節點的費用佔比分析和變化趨勢。支援如下付費售賣策略:
|
| 更換節點付費策略成本節省預測性分析,分析當前叢集該節點池中所有節點全部更換為不同付費售賣策略後,可以節省或會帶來的超額成本,協助您最佳化資源群組合和付費策略。 |
節點的每小時成本/付費策略統計 - 原價賬單成本 | 節點池中所有節點費用與付費策略的統計。 |
CS Cost Application 應用維度成本分析
應用大盤以Label萬用字元匹配的方式,能夠篩選出您關心的應用進行成本、資源的統計,側重於情境化的成本最佳化,典型情境包括巨量資料業務、AI業務、彈性業務。
通過Label萬用字元匹配的方式,您不僅可以監控單應用的成本和資源用量,還可以對多個有相關性的應用進行監控。例如巨量資料工作流程的情境,可以為流程中的所有應用加上一致性的Label,從而對整個工作流程業務進行成本分析。
篩選維度
參數選項 | 描述 |
命名空間(Namespace) | 叢集成本統計指標選項,包含優惠後實際賬單成本和原價賬單成本統計:
關於應付金額和官網價的詳細介紹,請參見明細賬單(已下線重新導向)。 |
命名空間(Namespace) | 選擇分析的叢集的命名空間,預設為All,即所有命名空間。 |
工作負載類型 | 叢集資來源物件類型。 |
工作負載名稱 | 根據資來源物件類型,選擇資源負載名稱。 |
標籤對篩選(LabelSelector) | 輸入應用Pod的標籤。支援使用 如果標籤key中包含 需要轉換為:
|
成本分攤模型 | 成本分攤模型選項,包含單資源模型和權重混合資源模型,具體分為如下幾類。
關於成本分攤模型選擇的詳細介紹,請參見成本估算策略介紹。 |
時間範圍 | 選擇大盤時間範圍,預設為最近7天。您可以設定該項查看不同時間範圍的成本、資源趨勢。 |
費用概覽
指標 | 描述 |
應用花費 | 當前所選應用在大盤所查詢時間範圍的花費成本,按原價賬單成本統計。 |
應用當前副本數 | 統計分析該應用峰穀值的Pod副本數。 |
應用占整個叢集/命名空間資源使用率 | 該應用資源在叢集、命名空間中的資源佔比。 |
所在節點每小時成本 | 應用所在的每個節點每核時的單價。 |
應用已耗用時間 / 總消耗的核時資源數 | 按應用的已耗用時間統計。應用總消耗的核時資源數。 |
計算資源使用率 | CPU和記憶體的利用率(Usage / Request)。 |
Pod維度業務成本分析 | 查看應用中包含的各Pod的資源情況和即時估算成本。 |
應用預估花費趨勢 | 一段時間內應用每小時費用成本、單位核時價格的變化的趨勢。 |
應用Pod規模趨勢 | 應用的Pod規模副本數趨勢統計。 |
| CPU、記憶體、GPU的請求和使用趨勢圖含義:
應用已指派且未使用資源=藍色柱狀圖-黃色柱狀圖 叢集剩餘資源可分配量=Y軸-藍色柱狀圖 分析浪費流程:
|
付費策略及Pod用量
指標 | 描述 |
| 分析當前應用中所有節點全部更換為不同付費售賣策略後,可節省或會帶來的超額成本,協助您最佳化資源群組合和付費策略。 |
| 包含應用所在節點付費策略統計,應用所在節點的每小時成本和付費策略統計,用於分析應用中所在節點的不同付費策略分布與趨勢。 |
| 通過成本費用分析部門成本消耗情況,協助您識別閑置率高的應用,指標說明如下:
|
常見問題
為什麼開啟成本可視化後沒有資料顯示?
檢查叢集是否配置NAT Gateway。由於部分地區不支援通過內網endpoint查詢賬單,請確認您的叢集具備訪問公網能力。
花費日環比和明日預測花費需要連續採集兩天的費用資料後才顯示。
為什麼命名空間的費用相加與實際的費用賬單不相等?
命名空間的費用是通過成本估算來進行核算的,並非直接通過賬單分析得出。因此,在做費用估算的時候,是通過目錄價進行計算的,當叢集的花費包含代金券、折扣、節約計劃等抵扣策略的時候,會出現一定的資料偏差。但是,可以通過命名空間的比例乘以叢集的總費用進行費用的分賬。
為什麼賬單中展示的雲產品沒有包括叢集使用的所有雲產品?
成本分析只統計本叢集獨享的雲產品,對於多叢集共用的雲產品,不在成本分析的賬單統計範圍內。
成本洞察功能依賴費用與成本控制台的費用標籤功能,即依賴於雲產品標籤中的特定標識(key:value=ack.aliyun.com:{{叢集ClusterId}})來實現叢集成本的追蹤與統計。如果您在費用標籤頁面關閉了此標籤,那麼叢集層級的成本統計將會失效。為瞭解決成本統計失效問題,您需要重新在費用標籤管理頁面啟用ack.aliyun.com和ack.alibabacloud.com/nodepool-id標籤。
為什麼本月/本周累計花費比實際低
叢集從成本洞察組件成功開通後才開始統計產生的費用,不會統計組件開通前的資料。