管控中心提供營運視窗和營運事件兩大模組,用於管理平台對專案空間內資源執行計畫內變更的時間範圍與事件記錄。
模組說明
在全託管Serverless架構下,底層基礎設施的計劃內維護(如系統升級、節點輪轉、熱遷移)可能導致運行中的作業發生短暫Failover。通過管控中心,可將計劃內變更限制在指定的營運視窗內執行,在業務高峰時段自動延遲變更,降低非預期中斷對業務的影響。
營運視窗:自訂允許平台執行底層資源變更的時間範圍。視窗期內,平台可執行無感遷移、節點輪轉等操作;視窗期外,所有計劃內變更將被自動延遲至下一個營運視窗執行。
營運事件:集中展示由平台發起的計劃內維護操作記錄,包括ECS執行個體維護、節點輪轉、宿主機熱遷移等。提供事件的全生命週期視圖,支援事後追溯與複盤。
營運視窗在專案空間維度生效,作用於該空間內的全部資源。
若未配置任何營運視窗,平台採用預設策略,即每日02:00–06:00(UTC+8)為允許變更時段。
前提條件
已開通Realtime ComputeFlink版服務,詳情請參見開通Realtime ComputeFlink版。
擁有目標專案空間的Owner或Admin許可權。
營運視窗
建立營運視窗
在左側導覽列,單擊管控中心。
在營運視窗頁簽,單擊建立營運視窗。
配置以下參數。
參數
說明
視窗名稱
營運視窗的名稱。長度為 2~200 個字元,支援中文、英文、數字及
-._符號。資源範圍
營運視窗的生效範圍。當前僅支援全部(專案空間級),即對當前專案空間內的所有資源生效。
週期
營運視窗的執行頻率,支援每天、每周和每月三種周期。選擇每周時,需勾選具體的星期幾;選擇每月時,需勾選具體的日期。若選擇的日期在當月不存在(如31日),則該月不生效。
時間範圍(UTC)
每次營運視窗的起止時間,以UTC時區表示。頁面同時顯示對應的本地時間(UTC+08:00),便於確認。
說明單個視窗時間長度不少於1小時,支援跨天設定(如23:00–01:00)。
按月重複時,每月至少設定 5 個變更日,且任意兩個相鄰變更日之間的間隔不得超過 7 天(跨月首尾日期同樣適用)。
是否啟用
控制營運視窗是否立即生效。開啟後儲存即立即生效;關閉則僅儲存配置,後續可隨時開啟。
單擊確定。
管理營運視窗
在營運視窗列表中,可查看各視窗的名稱、資源範圍、時間範圍和生效狀態,並執行以下操作:
詳情:查看營運視窗的完整配置資訊及關聯的歷史營運事件。
編輯:修改視窗的名稱、時間範圍或啟用狀態。
刪除:刪除該營運視窗。刪除後,平台不再受此視窗約束。若所有自訂視窗均被刪除,將回退至平台預設策略(每日02:00–06:00)。
當前處于禁止變更期時,頁面頂部將顯示提示資訊,表明所有計劃內變更已被延遲至下一個營運視窗期執行。
查看營運事件
切換至營運事件頁簽,可查看近30天內發生及預計發生的計劃內營運事件。
事件列表
欄位 | 說明 |
事件名稱 | 底層引擎營運事件的名稱。 |
事件類型 | 事件來源類型,如Flink營運、ECS計劃內維護、ECS異常宕機等。 |
觸發時間 | 事件預計或實際發生的時間。 |
事件狀態 | 事件的目前狀態,包括:已完成(變更成功,作業已恢複)、預計發生(已調度,等待執行)、已延遲(不在營運視窗內,延遲至下一視窗)、需人工幹預(變更失敗或逾時,需手動重啟作業)。 |
影響作業數 | 受該事件影響的作業數量。單擊可查看具體作業列表及恢複狀態。 |
事件詳情
單擊事件列表中的查看詳情,可查看以下資訊:
基礎資訊:事件來源、預計執行時間段、觸發時間等。
視窗匹配情況:該事件是否命中已配置的營運視窗規則。
影響作業分析:受影響的作業列表及各作業的目前狀態。
事件歷史:事件的完整生命週期記錄。
配置營運事件通知
營運事件支援通過警示通知推送,確保關鍵事件不遺漏。
常規通知:營運事件狀態變更時推送,包括即將執行、已完成、已延遲等狀態。
強制變更通知:當營運事件未命中任何營運視窗,且距離最晚執行時間不足24小時時,平台將強制執行變更,並通過控制台彈窗、頂部Banner進行推送。
常見問題
多個營運視窗時間重疊時如何處理?
系統允許視窗重疊。重疊的時間段均視為允許變更期,平台可在該時間段內執行變更。
變更被延遲的原因是什嗎?
計劃內營運事件發生時,若目前時間不在任一營運視窗內,系統會自動將變更延遲至下一個營運視窗執行。可在營運事件頁簽查看被延遲的事件,狀態標記為已延遲。
營運視窗是否支援作業層級的控制?
當前僅支援專案空間層級。作業層級的細粒度控制將在後續版本中支援。
跨天的營運視窗如何生效?
支援跨天設定(如23:00–01:00)。系統將該時間段拆分為當日23:00–24:00和次日00:00–01:00兩個片段。目前時間落在任一片段內,即視為命中營運視窗。