如果您已按照安裝Agent為伺服器成功安裝Situation Awareness ServiceAgent,但在Situation Awareness Service控制台上仍看到該伺服器的保護狀態為未受保護,則說明Agent處於離線狀態,請參照本文進行排查。

背景信息

如果您的Situation Awareness ServiceAgent處於離線狀態,請按照以下步驟進行排查:

操作步骤

  1. 登入您的伺服器,查看Situation Awareness ServiceAgent相關進程(AliYunDunAliYunDunUpdate)是否正常運行。

    如果Situation Awareness ServiceAgent相關進程無法運行,建議您重啟伺服器,或者參考安裝Agent重新安裝Situation Awareness ServiceAgent。

    • Windows系統
      在工作管理員中,查看相關進程是否正常運行。

    • Linux系統
      執行 top命令,查看相關進程是否正常運行。

  2. 對於首次安裝Situation Awareness ServiceAgent的伺服器,如果在安裝Agent後,保護狀態仍然為未受保護,請參考以下方法,重新啟動Situation Awareness ServiceAgent:
    • Linux 系統:執行killall AliYunDun && killall AliYunDunUpdate && /usr/local/aegis/aegis_client/aegis_10_xx/AliYunDun命令。
      说明 您必須將命令中的 xx替換為該目錄下的最大的數字。
    • Windows 系統:在服務項中重新啟動以下兩個服務項,選中對應服務,右鍵選擇重新啟動即可。

  3. 檢查您的伺服器網路連接是否正常。
    • 伺服器有公網IP(如傳統網路、EIP、雲外機器)
      • Windows 系統:在命令列中執行ping jsrv.aegis.aliyun.com -l 1000命令。
      • Linux 系統:執行ping jsrv.aegis.aliyun.com -s 1000命令。
    • 伺服器無公網IP(如金融雲、VPC專用網路)
      • Windows 系統:在命令列中執行ping jsrv3.aegis.aliyun.com -l 1000命令。
      • Linux 系統:執行ping jsrv3.aegis.aliyun.com -s 1000命令。
  4. 如果解析不通,請使用以下方法,檢查您的伺服器網路連接狀況:
    1. 確認您的伺服器的DNS服務正常運行。如果DNS服務無法運行,重啟您的伺服器,或者檢查伺服器DNS服務是否有故障。
    2. 檢查伺服器是否設定了防火牆ACL規則或阿里雲安全性群組規則。如果有,請確認已將Situation Awareness Service的服務端IP加入防火牆白名單(出、入方向均需添加)以允許網路訪問。
      说明 請將下列IP段的80連接埠添加至白名單,最後一個IP段需要同時添加80和443連接埠至白名單。
      • 140.205.140.0/24 80
      • 106.11.68.0/24 80
      • 110.173.196.0/24 80
      • 106.11.68.0/24 80
      • 100.100.25.0/24 80 443
    3. 檢查您的伺服器公網頻寬是否為零。如果您的伺服器公網頻寬為零,請參考以下步驟進行處理:
      1. 在您伺服器的hosts檔案添加以下網域名稱解析記錄:
        • 100.100.25.3 jsrv.aegis.aliyun.com
        • 100.100.25.4 update.aegis.aliyun.com
      2. 修改hosts檔案後,執行ping jsrv.aegis.aliyun.com命令。
        说明 如果返回的結果不是 100.100.25.3,請您重啟伺服器或檢查伺服器DNS服務是否有故障。
      3. 如果仍然無法解析到正確的IP,您可以嘗試修改Situation Awareness ServiceAgent安裝目錄下conf目錄中的network_config設定檔,將t_srv_domainh_srv_domain對應的值分別修改為100.100.25.3100.100.25.4。修改完成後,重啟Situation Awareness ServiceAgent進程。
        说明 修改前請務必備份 network_config設定檔。

        此方法只適用於公網頻寬為零,且保護狀態為未受保護的伺服器。

    4. 如果Ping命令執行解析成功,再次嘗試通過Telnet命令串連解析出的網域名稱IP的80連接埠(例如,執行telnet 140.205.140.205 80命令),查看是否連通。如果無法連通,請確認防火牆是否存在相關限制。
  5. 檢查您的伺服器CPU、記憶體是否長期維持較高佔用率(如 95%、100%),此情況可能導致Situation Awareness ServiceAgent進程無法正常工作。
  6. 檢查伺服器是否已安裝第三方的防病毒產品(如安全狗、雲鎖等)。部分第三方防毒軟體可能會禁止Situation Awareness ServiceAgent外掛程式訪問網路。

    如果有,請暫時關閉該產品,並重新安裝Situation Awareness ServiceAgent。