全部產品
Search
文件中心

:自助問題排查功能修複執行個體問題的操作指南

更新時間:Jun 28, 2025

執行個體健康診斷功能支援對執行個體無法啟動問題進行自助診斷排查,您可以通過健康診斷瞭解執行個體無法啟動的具體原因,並在掛載修複盤的情況下啟動並登入執行個體,修複執行個體原來作業系統中導致無法啟動的相關配置。您可以通過本文瞭解修複盤的操作說明,以及ECS執行個體無法啟動的解決方案。

適用情境

當您啟動或重啟ECS執行個體後,ECS執行個體生命週期狀態一直處於啟動中(Starting)運行中(Running),並且執行個體健康情況一直處於初始化中(Initializing)。此時執行個體的作業系統未能啟動,無法通過SSH或RDP遠端連線ECS執行個體。只能通過VNC登入執行個體,查看執行個體作業系統的啟動進度和一些錯誤記錄檔。

該問題可能是因為ECS執行個體的作業系統內某些配置不當,導致作業系統無法正常啟動。您可以通過執行個體健康診斷功能對該問題進行診斷,並參考診斷結果進行問題修複。

前提條件

ECS執行個體必須處於已停止狀態,具體操作,請參見停止執行個體

修複流程

通過執行個體健康診斷修複執行個體無法啟動問題的具體流程如下:

步驟一:發起執行個體無法串連或啟動異常診斷釋

重要

在修複執行個體作業系統無法啟動問題時,您可能會修改執行個體原系統硬碟的系統配置。為了避免不必要的風險,建議您在診斷前,先對執行個體的系統硬碟建立一個快照,以便後續資料恢複。

  1. 訪問ECS控制台-自助問題排查

  2. 在頁面左側頂部,選擇目標資源所在的資源群組和地區。地區

  3. 執行個體問題排查頁簽,單擊執行個體無法串連或啟動異常問題類型。

  4. 選擇執行個體的作業系統無法正常啟動,且執行個體狀態已停止問題、需要診斷的執行個體ID及時間範圍,然後單擊開始排查

    說明

    需要診斷的ECS執行個體必須處於已停止狀態,具體操作,請參見停止執行個體

    image

    診斷完成後,執行個體處於運行中修複中狀態。

    運行中、修複中

步驟二:查看診斷結果

不同於其他健康診斷情境,執行個體無法啟動的健康診斷完成後,診斷結果無論是嚴重、警告還是通過,被診斷的執行個體均會被掛載一個修複盤,您可以在診斷報告中查看到修複盤的相關資訊,並且可以根據診斷報告顯示的具體問題進行執行個體修複。關於如何查看診斷報告,請參見診斷項與診斷結果說明

執行個體被掛載修複盤的說明

執行個體通過修複盤中的作業系統啟動時,相關資訊說明如下:

修複盤相關資訊

說明

作業系統

  • Linux:Alibaba Cloud Linux 2.1903 LTS 64位

  • Windows:Windows Server 2016 資料中心版 64位中文版

訪問帳號

  • Linux:root

  • Windows:Administrator

訪問密碼

從診斷報告中查看

重要

即使在修複盤系統中修改了密碼,在重啟修複盤系統之後也會恢複到系統所提供的密碼,無法使用執行個體原來系統中的任何使用者名稱和密碼進行登入。

雲端硬碟讀寫

  • 系統硬碟:不支援

    修複盤系統是從特定虛擬存放裝置啟動的系統,對於修複盤系統本身,所有的修改操作只會暫存於記憶體中,只在當次運行過程中有效,重啟修複盤系統後就會清空並失效。

  • 資料盤:支援

建立快照

  • 系統硬碟:不支援

  • 資料盤:支援

診斷結果說明

診斷結果主要包括兩部分內容,修複盤資訊與診斷結果和建議,如下圖所示:

診斷結果說明

修複盤資訊說明如下:

  • 上圖中①:展示了自動掛載修複盤後ECS提供的登入執行個體掛載的修複系統的使用者名稱(Linux系統為root,Windows系統為Administrator)及密碼資訊,您可以通過該資訊登入掛載了修複盤的ECS執行個體。

  • 上圖中②:提供了使用VNC遠端連線該ECS執行個體的捷徑。ECS執行個體掛載修複盤的狀態下,您只能通過該入口登入ECS執行個體進行問題修複,Workbench、第三方遠端連線工具等方式均無法直接登入該執行個體。

  • 上圖中③:提供了卸載修複盤的入口。您可以根據健康診斷結果和修複進展,通過該入口卸載修複盤,使執行個體的恢複至原來的作業系統。具體說明如下:

    • 如果健康診斷的結果為通過,說明執行個體健康診斷未發現執行個體異常問題,您可以參考步驟四:將ECS執行個體恢複至正常模式後,通過VNC遠端連線ECS執行個體進一步排查具體問題。如還未解決,請提交工單,聯絡支援人員擷取協助。

    • 如果健康診斷的結果為嚴重或者警告,說明您的ECS執行個體存在異常,您需要在診斷報告中,通過VNC遠端連線(上圖中②)ECS執行個體,然後使用修複盤對應的登入資訊(上圖中①)登入執行個體。當您在執行個體內完成異常修複後,再卸載修複盤。

異常詳情和修複建議說明如下:

異常詳情和修複建議主要展示執行個體作業系統配置不當的具體問題,並且給出修複建議。您可以單擊推薦的修複文檔,查看具體的問題描述及修複建議進行修複。具體操作,請參見步驟三:修複執行個體作業系統配置不當問題

步驟三:修複執行個體作業系統配置不當問題

  1. 遠端連線問題執行個體。

    您可以在診斷結果介面單擊VNC遠端連線,使用診斷報告中提供的臨時登入執行個體的使用者名稱(Linux系統為root,Windows系統為Administrator)和密碼資訊登入掛載了修複盤的ECS執行個體。具體操作,請參見通過VNC串連執行個體

    說明

    當ECS執行個體處於正在掛載修複盤的模式下時,只能通過VNC遠端連線。

  2. 查看問題執行個體原有系統硬碟的掛載資訊。

    • Linux系統

      在臨時掛載的修複盤中,問題執行個體原有系統硬碟的檔案系統會被掛載到某一臨時目錄下。您可以通過以下任一方式查看臨時目錄資訊:

      • 在系統硬碟詳情頁的掛載執行個體進行查看,臨時目錄格式樣本為/tmp/ecs-offline-diagnose_disk-uf67g4wwius3metl****,其中uf67g4wwius3metl****為執行個體原有系統硬碟的雲端硬碟序號,

      • 在臨時掛載的修複盤中,運行mount命令查看所在的臨時目錄資訊。例如,問題執行個體原有系統硬碟的裝置路徑為/dev/vda,命令樣本如下所示:

        mount | grep /dev/vda

        返回結果如下所示:

        /dev/vda1 on /tmp/ecs-offline-diagnose_disk-uf67g4wwius3metl**** type ext4 (rw,relatime)
      • Windows系統:掛載的修複盤為X盤,原系統中系統硬碟和資料盤符不變。

  3. 修複執行個體作業系統配置不當問題。

    以下提供了常見的執行個體無法啟動的解決方案,您可以根據診斷結果中的診斷項詳情,查看執行個體無法啟動的原因,然後根據不同的原因選擇對應的解決方案。

步驟四:將ECS執行個體恢複至正常模式

當執行個體無法啟動問題修複完成後,您需要卸載修複盤,將執行個體恢複至原來使用的作業系統。

說明

卸載修複盤之後,將無法自動再次掛載修複盤,您只能通過再次發起執行個體作業系統無法啟動診斷,才能觸發系統自動為執行個體掛載修複盤。

方式一:從診斷報告處將執行個體恢複至原來作業系統

  1. 訪問ECS控制台-自助問題排查

  2. 在頁面左側頂部,選擇目標資源所在的資源群組和地區。地區

  3. 執行個體問題排查頁簽,然後單擊查看歷史

  4. 執行個體健康診斷頁簽,單擊對應診斷報告操作列的查看報告

  5. 單擊卸載修複盤

  6. 您確定要卸載修複盤嗎?對話方塊,閱讀注意事項後,單擊立即卸載

    重要

    卸載修複盤需要先停止執行個體,如未停止執行個體,需要按照介面提示停止執行個體後再卸載修複盤。

  7. 啟動執行個體,然後遠端連線ECS執行個體,確保可以正常串連。

    卸載成功後,ECS執行個體狀態為已停止,您需要啟動執行個體後才能遠端連線。

    啟動執行個體

方式二:從執行個體列表頁恢複執行個體

  1. 訪問ECS控制台-執行個體

  2. 在頁面左側頂部,選擇目標資源所在的資源群組和地區。地區

  3. 找到目標執行個體,停止該ECS執行個體。

    具體操作,請參見停止執行個體

  4. 將滑鼠懸浮至修複中的狀態上,然後單擊卸載修複盤

    您也可以單擊目標執行個體ID,在執行個體詳情頁面卸載修複盤

    卸載修複盤

  5. 您確定要卸載修複盤嗎?對話方塊,閱讀注意事項後,單擊立即卸載

  6. 啟動執行個體,然後遠端連線ECS執行個體,確保可以正常串連。

    卸載成功後,ECS執行個體狀態為已停止,您需要啟動執行個體後才能遠端連線。

    啟動執行個體