網路智慧型服務具備豐富的雲網路診斷庫,覆蓋穩定性、安全、效能、成本最佳化和卓越營運等檢查項。通過網路巡檢提供雲網路架構可觀測服務,協助您精準發現異常並擷取最佳化建議。
使用情境
在您搭建和維護大型網路組網和資源時,由於短時間對雲產品的瞭解有限,可能導致存在與最佳實務有偏差的網路設定情境,後續通過不斷的完善配置,將會有大量的網路資源執行個體,但由於人力難以支撐對網路資源的配置和使用進行校正和檢查,可以通過網路巡檢能力對整體網路架構和資源進行排查梳理,並為您提供網路最佳化建議。
巡檢項
巡檢資源類型 | 巡檢類別 | 巡檢項 | 巡檢說明 | 風險說明 | 風險等級 | 最佳化建議 |
EIP | 網路穩定性 | EIP頻寬水位檢查 | 檢查在巡檢周期間EIP頻寬水位的使用方式,統計頻寬利用率過高,或頻寬超限丟包的發生頻次,協助評估目前資源頻寬是否滿足業務發展訴求,識別因頻寬不足導致業務受損的網路風險。 | 最近一次巡檢間隔周期內,觸發過公網頻寬即將超限風險預警。 | 中 | 請調整EIP頻寬規格。具體操作,請參見訂用帳戶EIP變更配置或隨用隨付EIP變更配置。 |
在最近一次巡檢間隔周期內,觸發過公網頻寬超限丟包警示。 | 高 | 請調整EIP頻寬規格。具體操作,請參見訂用帳戶EIP變更配置或隨用隨付EIP變更配置。 | ||||
EIP運行狀態檢查 | 檢查彈性EIP是否存在運行異常的資源。 | EIP處于禁用或未啟用狀態。 | 低 | EIP處于禁用或未啟用狀態,請檢查EIP執行個體是否處於中間態等其他異常狀態。 | ||
網路成本最佳化 | 閑置EIP檢查 | 檢查彈性EIP是否存在閑置資源。 | EIP未綁定執行個體。 | 低 | EIP未綁定執行個體,但仍需進行付費,建議根據業務訴求分析是否需進行EIP執行個體釋放,以節約費用。 | |
NAT | 網路穩定性 | NAT處理水位檢查 | 檢查在巡檢周期間NAT Gateway的處理水位情況,包括識別並發串連數、建立串連數、流量處理速率和SNAT源連接埠超負載使用方式,協助評估目前資源配置是否滿足業務發展訴求,識別因資源水位不足導致業務受損的網路風險。 | 在最近一次巡檢間隔周期內,觸發過NAT會話超限丟棄串連。 | 中 | 請提升NAT Gateway執行個體規格,或將NAT Gateway執行個體變更為隨用隨付模式。更多資訊,請參見: |
在最近一次巡檢間隔周期內,觸發過NAT建立會話超限丟棄警示。 | 高 | 請重新分配流經NAT Gateway執行個體的流量,或將NAT Gateway執行個體變更為隨用隨付模式以提升流量處理能力。更多資訊,請參見: | ||||
在最近一次巡檢間隔周期內,觸發過SNAT源連接埠分配失敗警示。 | 高 | 請增加SNAT規則的位址集區EIP數量。更多資訊,請參見公網 NAT Gateway。 | ||||
CEN | 網路穩定性 | 跨地區頻寬水位檢查 | 檢查在巡檢周期間雲企業網跨地區頻寬水位的使用方式,統計頻寬利用率過高或頻寬超限丟包的發生頻次,協助評估目前資源頻寬是否滿足業務發展訴求,識別因頻寬不足導致業務受損的網路風險。 | 在最近一次巡檢間隔周期內,觸發過跨地區串連頻寬超限丟包警示。 | 高 | 建議您提升跨地區串連頻寬。 |
跨地區串連的流量調度隊列限速丟棄。 | 高 | |||||
TR串連高可用性檢查 | 檢查網路執行個體接入TR高可用性不足導致故障發生時業務停用潛在風險,為了確保網路的高可用性,網路執行個體被串連至轉寄路由器TR後,組網最佳實務推薦業務保證式轉送路由器下配置有冗餘鏈路。 | 檢測到VPC串連TR時只使用了單可用性區域下的資源,當該可用性區域故障後,無法切換到其他可用性區域,可能造成您的業務故障。 | 高 | 為了確保網路的高可用性,VPC串連至轉寄路由器後,需保證式轉送路由器下配置有冗餘鏈路,建立VPC串連時建議在企業版轉寄路由器支援的每個可用性區域中均指定一個交換器執行個體,以實現VPC串連可用性區域層級的容災並減少流量繞行。 | ||
TR配置路由風險檢查 | 檢查當前TR路由的相關配置是否存在風險,並提供配置最佳化建議。 | 基礎版TR路由表路由條目數量已達到最大配額的80%,超出後新增路由將無法載入到TR路由表中,可能導致網路不通。 | 中 | 建議升級至企業版轉寄路由器。相對於基礎版轉寄路由器,企業版轉寄路由器提供40000條路由條目額度,並提供自訂路由表、流日誌等豐富的功能特性。 | ||
VPC接入TR路由風險檢查 | 檢查VPC接入TR是否存在路由存取違規與風險,提供配置最佳化建議。 | 接入同一個CEN的VPC間存在私網網段重疊,可能造成CEN中的路由衝突。 | 中 | 建議您合理規劃VPC網段,使加入到同一個CEN的VPC及交換器使用不重疊的網段。 | ||
VPC串連頻寬水位檢查 | 檢查在巡檢周期間雲企業網VPC串連頻寬水位的使用方式,統計頻寬超限丟包的發生頻次,協助評估目前資源頻寬是否滿足業務發展訴求,識別因頻寬不足導致業務受損的網路風險。 | 在最近一次巡檢間隔周期裡,觸發過VPC串連頻寬超限丟包警示。 | 高 | 建議為VPC串連開啟流日誌功能,通過流日誌分析業務流量佔比是否符合預期。 | ||
VPN | 網路穩定性 | VPN水位限制檢查 | 檢查在巡檢周期間VPN服務水位情況,統計頻寬超限風險和BGP動態路由傳播超限的發生頻次,協助評估目前VPN服務健康度,識別因資源配置不足導致業務受損的網路風險。 | 在最近一次巡檢間隔周期內,觸發過BGP動態路由數量超限風險警示。 | 高 | 建議關注,若出現超規格情況建議您根據實際網路規劃在對端VPN裝置上進行網段彙總。 |
在最近一次巡檢間隔周期內,觸發過VPN頻寬超限風險警示。 | 中 | 請關注這條鏈路上的執行個體頻寬是否符合實際業務要求,建議升配VPN頻寬規格或新購執行個體擴大VPN的頻寬;若無異常可忽略此警示。 | ||||
VPN冗餘檢查 | 檢查VPN冗餘配置。 | VPN雙隧道中存在一條未協商成功的隧道,導致AZ高可用能力失效。 | 高 | 建議您將該執行個體的所有隧道都和對端建立IPsec-VPN串連以恢複AZ級高可用能力。具體操作,請參見IPsec串連(VPN網關)。 | ||
VPN執行個體仍然是單可用性區域形態,不具備多可用性區域容災能力,存在重大隱患。 | 高 | 請為VPN執行個體開啟AZ高可用,並同時啟用雙隧道。 | ||||
ALB | 網路穩定性 | ALB虛擬IP處理水位檢查 | 檢查在巡檢周期間ALB虛擬IP的負載情況,包括識別會話、串連、QPS和頻寬的負載情況,協助評估目前資源配置是否滿足業務發展訴求,識別因資源負載不足導致業務受損的網路風險。 | 在最近一次巡檢間隔周期內,觸發過ALB會話超限導致建立串連丟失警示。 | 高 | ALB網域名稱解析的單一VIP有建立串連數限額,建議通過CNAME網域名稱解析的方式使用ALB。具體操作,請參見為ALB配置CNAME解析。 |
在最近一次巡檢間隔周期內,觸發過ALB QPS超限警示。 | 高 | ALB網域名稱解析的單一VIP有QPS限額,建議通過CNAME網域名稱解析的方式使用ALB。具體操作,請參見為ALB配置CNAME解析。 | ||||
在最近一次巡檢間隔周期內,觸發過ALB私網頻寬超限丟包警示。 | 高 | ALB網域名稱解析的單一VIP有頻寬限額,建議通過CNAME網域名稱解析的方式使用ALB。具體操作,請參見為ALB配置CNAME解析。 | ||||
ALB高可用部署檢查 | 檢查ALB監聽下的後端伺服器是否為多可用性區域部署,以保障監聽服務高可用運行。 | ALB監聽的多個後端伺服器僅部署在單一可用性區域(針對預設轉寄伺服器組)。 | 中 | 當前ALB監聽部署架構存在AZ級風險,若發生AZ級故障,服務將不可用,建議將監聽及轉寄規則的後端伺服器分散部署在兩個可用性區域及以上,減少故障爆發半徑;若涉及伺服器跨可用性區域遷移,請參見遷移指引。 | ||
NLB | 網路穩定性 | NLB虛擬IP處理水位檢查 | 檢查在巡檢周期間NLB虛擬IP的負載情況,包括識別建立串連和並發串連的負載情況,協助評估目前資源配置是否滿足業務發展訴求,識別因資源負載不足導致業務受損的網路風險。 | 在最近一次巡檢間隔周期內,觸發過NLB失敗串連數驟增警示。 | 高 | 出現該現象的可能原因:
|
在最近一次巡檢間隔周期內,觸發過NLB建立串連丟棄警示。 | 高 | 出現該現象的可能原因:
| ||||
在最近一次巡檢間隔周期內,觸發過NLB建立串連超限警示。 | 高 | 超出NLB單VIP自動彈性上限,連續出現建立串連請求丟棄現象,建議拆分多個NLB執行個體或聯絡客戶經理單獨報備。 | ||||
在最近一次巡檢間隔周期內,觸發過NLB並發串連超限警示。 | 高 | 超出NLB單VIP自動彈性上限,連續出現建立串連請求丟棄現象,建議拆分多個NLB執行個體或聯絡客戶經理單獨報備。 | ||||
NLB高可用部署檢查 | 檢查NLB監聽下的後端伺服器是否為多可用性區域部署,以保障監聽服務高可用運行。 | NLB監聽的多個後端伺服器僅部署在單一可用性區域。 | 中 | 當前NLB監聽部署架構存在AZ級風險,若發生AZ級故障,服務將不可用,建議將監聽的後端伺服器分散部署在兩個可用性區域及以上,減少故障爆發半徑;若您選擇進行伺服器跨可用性區域遷移,請參見遷移指引。 | ||
CLB | 網路穩定性 | CLB處理水位檢查 | 檢查在巡檢周期間CLB的負載情況,包括識別會話、串連和頻寬的負載情況,協助評估目前資源配置是否滿足業務發展訴求,識別因資源負載不足導致業務受損的網路風險。 | 在最近一次巡檢間隔周期內,觸發過CLB頻寬超限丟包警示。 | 高 | 建議升配CLB執行個體頻寬。具體操作,請參見隨用隨付CLB執行個體變更配置。 |
在最近一次巡檢間隔周期內,觸發過CLB會話超限建立串連丟失警示。 | 高 | 建議升配CLB執行個體或將CLB執行個體遷移為ALB執行個體或NLB執行個體。具體操作,請參見: | ||||
在最近一次巡檢間隔周期內,觸發過CLB串連失敗數驟增警示。 | 高 | 出現該現象的常見原因為後端伺服器規格超限、負載過高或業務異常等,建議您檢查後端業務狀態。 | ||||
VBR | 網路穩定性 | BGP串連狀態檢查 | 檢查在巡檢周期間專線BGP串連的運行狀態,統計專線連接埠異常的發生頻次,協助觀測電訊廠商專線鏈路的品質,及時發現穩定性風險。 | 在最近一次巡檢間隔周期內,觸發過BGP串連故障。 | 高 | 聯絡線路提供電訊廠商檢查物理專線是否有異常。 |
物理專線連接埠檢查 | 檢查在巡檢周期間物理專線連接埠的運行狀態,統計BGP串連異常的發生頻次,協助觀測電訊廠商專線鏈路的品質,及時發現穩定性風險。 | 在最近一次巡檢間隔周期內,觸發過專線連接埠或鏈路故障警示。 | 高 | 聯絡線路提供電訊廠商檢查物理專線是否有異常。 | ||
VBR靜態路由健康配置檢查 | 檢查VBR串連是否配置了健全狀態檢查。 | CEN上配置了靜態路由指向VBR,但是沒有在CEN上配置相應的健全狀態檢查。 | 高 | 將VBR串連至CEN後,您可以通過CEN的健全狀態檢查功能探測VBR關聯的物理專線的連通性。在CEN和本機資料中心存在冗餘路由的情境下,健全狀態檢查探測到物理專線故障後支援自動切換到可用路由,保障流量傳輸不中斷。 | ||
VBR上聯沒有配置健全狀態檢查。 | 高 | 本機資料中心通過冗餘專線串連到VPC時,建議您在本機資料中心側和阿里雲側分別配置健全狀態檢查來檢測物理專線的連通性。當其中一條物理專線檢測出故障時,可以順利切換到另一條物理專線。 | ||||
VBR冗餘缺失檢查 | 檢查VBR冗餘配置的完整性,識別專線情境穩定性風險。 | VPC到VBR完全未配置冗餘線路。 | 低 | VPC到VBR完全未配置冗餘線路,您可以根據業務訴求進行線路冗餘方案選型,請參見通過VBR上連實現本地IDC串連上雲。 | ||
VPC到VBR部分網段未配置冗餘線路。 | 低 | 請確認未配置冗餘的路由網段是否存在業務流量;若存在,建議配置冗餘線路。您可以根據業務訴求進行線路冗餘方案選型,請參見通過VBR上連實現本地IDC串連上雲。 | ||||
TR到VBR部分網段未配置冗餘線路 | 低 | 請確認未配置冗餘的路由網段是否存在業務流量;若存在,建議配置冗餘線路。您可以根據業務訴求進行線路冗餘方案選型,請參見通過ECR實現本地IDC串連上雲。 | ||||
TR到VBR完全未配置冗餘線路。 | 低 | TR到VBR完全未配置冗餘線路,您可以根據業務訴求進行線路冗餘方案選型,請參見通過ECR實現本地IDC串連上雲。 | ||||
PrivateLink | 網路穩定性 | PrivateLink終端節點高可用部署檢查 | PrivateLink協助使用者在VPC和本機資料中心中,通過私人網路安全穩定的訪問部署在其它VPC中的服務,檢查私網串連介面終端節點、終端節點服務是否為多可用性區域部署,以保障服務訪問高可用運行。 說明 僅能巡檢介面終端節點到終端節點服務這段鏈路的可用性區域級高可用風險,無法判斷通過該介面終端節點訪問的服務本身的可用性區域級高可用風險。 | 存在單可用性區域的介面終端節點執行個體 | 高 | 為介面終端節點執行個體新增新的可用性區域,確保多可用性區域容災。具體操作,請參見建立和管理終端節點網卡 。 說明 介面終端節點執行個體所包含的1個可用性區域的1個終端節點網卡為1個計費執行個體,增加可用性區域會增加費用。 |
PrivateLink終端節點服務高可用部署檢查 | 存在單可用性區域的終端節點服務執行個體 | 高 | 為終端節點服務添加服務資源,使終端節點服務在多個可用性區域提供服務。 |
查看網路巡檢報告
網路智慧型服務預設為您開啟免費的網路基礎巡檢任務,每周進行一次全面網路巡檢,提供巡檢報告。暫不支援建立自訂網路巡檢任務。
網路巡檢報告儲存時間長度為1年。
登入網路智慧型服務管理主控台。
在左側導覽列選擇網路巡檢。
在網路巡檢頁面,找到預設網路巡檢任務可進行以下操作。
查看最新一次巡檢報告詳情
在最新一次巡檢報告列單擊查看详细报告获取网络优化建议 >>。
在巡檢報告詳情頁面,您可以查看巡檢報告的基本資料、巡檢總結和巡檢詳情。
在巡檢詳情頁面,可以查看異常結果、最佳化建議以及受影響的資源。
查看歷史報告詳情
在最新一次巡檢報告列單擊查看历史报告 >>。
在歷史報告頁面歷史巡檢報告地區,找到目標巡檢報告,然後單擊巡檢報告ID或在操作列單擊查看報告。
在巡檢報告詳情頁面,您可以查看巡檢報告的基本資料、巡檢總結和巡檢詳情。
在巡檢詳情頁面,可以查看異常結果、最佳化建議以及受影響的資源。
管理網路巡檢任務
重新發起網路巡檢任務
如果您持有的資源有變更,您可以重新發起網路巡檢任務檢測當前資源的狀態。操作前請確保巡檢任務為已開啟狀態。
在網路巡檢頁面,找到目標網路巡檢任務,在最新一次巡檢報告列單擊查看详细报告获取网络优化建议 >>,在巡檢報告詳情頁面的右上方,單擊重新發起巡檢。
關閉、啟動網路巡檢任務
在網路巡檢頁面,找到預設網路巡檢任務,在操作列單擊關閉巡檢或啟動巡檢。
刪除網路巡檢任務
需先關閉巡檢後,才支援刪除網路巡檢任務。網路巡檢任務刪除後,網路巡檢報告也將被一併刪除。
在網路巡檢頁面,找到預設網路巡檢任務,在操作列單擊刪除。