Pod の問題の診断と修復 - Container Service for Kubernetes - Alibaba Cloud ドキュメントセンター

Container Intelligence Service は、Pod の問題のトラブルシューティングに役立つ Pod 診断を提供します。このトピックでは、診断項目とそれに対応するソリューションについて説明します。

Container Intelligence Service は、専門知識と AI モデルを組み合わせて問題を診断し、その根本原因を特定します。Pod 診断には、診断チェックと根本原因の特定が含まれます。

診断チェック：Pod、ノード、ノードコンポーネント、クラスターコンポーネント、および ECS Controller Manager のチェックを行います。
根本原因：特定された根本原因と修復の推奨事項を提供します。Pod 診断は、クラスターおよびノードから情報を収集して異常を特定し、その結果に基づいて詳細な診断を実行します。

重要

診断機能は、ご利用のクラスターのノード上でデータ収集プログラムを実行し、チェック結果を収集します。収集される情報には、システムバージョン、ワークロードのステータス、Docker、kubelet、およびシステムログからの主要なエラー情報が含まれます。データ収集プログラムは、お客様のビジネス情報や機密データを収集することはありません。

サポートされる異常シナリオ

以下の表は、Pod 診断および AI 支援診断でカバーされる典型的な異常シナリオの一覧です。

カテゴリ	異常シナリオ
Pod 診断	スケジューラが Pod を処理しない。
	スケジューリング制約に違反するため Pod をスケジューリングできない。
	Kubelet がスケジュール済みの Pod を処理しない。
	Pod がボリュームの準備完了を待機している。
	Pod が退去させられた。
	ノードのディスク領域不足により Pod が退去させられた。
	ノードのメモリ不足により Pod が退去させられた。
	ノードの inode 不足により Pod が退去させられた。
	Pod のサンドボックスコンテナの作成に失敗した。
	Pod が Terminating 状態でスタックしている。
	Pod 内のコンテナで OOM エラーが発生した。
	Pod 内のコンテナが予期せず終了した。
	Pod 内のコンテナが CrashLoopBackOff 状態である。
	Pod 内のコンテナが NotReady である。
	Pod がイメージのプルに失敗した。
	Pod がイメージのプル中にタイムアウトした。
AI 支援診断	Pod のステータスが異常である。
	Pod で OOM イベントが発生した。
	Pod 内のコンテナが予期せず終了した。
	Pod に ConfigMap または Secret の構成エラーがある。
	Pod がヘルスチェックに失敗した。
	Pod に PersistentVolumeClaim (PVC) の構成エラーがある。
	Pod がイメージのプルに失敗した。

診断プロセス

クラスター診断機能は、クラスターおよびノードから情報を収集して異常を特定し、その後詳細な診断を実行します。この機能は、エキスパートモードとAI モードの両方を統合して、問題の根本原因を特定します。各診断は、異常の特定、データ収集、診断項目のチェック、根本原因分析の 4 つのステージを経て結果を生成します。

異常の特定：ノードステータス、Pod ステータス、クラスターイベントストリームなどの基本データを収集し、現在の異常を迅速に分析します。
データ収集：異常の特定の結果に基づいてコンテキストデータを収集します。たとえば、ノード診断の場合、これにはKubernetesからのノード情報、対応するECS情報、およびDockerやkubeletなどのプロセスのステータスが含まれます。
診断項目のチェック：収集されたデータに基づいて主要なメトリックを評価します。たとえば、ノード診断の診断項目には、DockerプロセスのステータスやECSステータスが含まれます。特定の診断項目は診断の種類によって異なり、結果には各チェック項目とその説明が一覧表示されます。
根本原因分析：一部の問題については、収集されたデータと診断項目のチェックの結果に基づいて、システムが自動的に根本原因を分析します。

診断結果

結果は次の 2 種類に分類されます：

根本原因分析結果：検出された異常、特定された根本原因、および修正提案が含まれます。
診断項目のチェック結果：項目ごとのチェック結果が含まれます。これらは、根本原因分析が見逃す可能性のある原因を明らかにすることができます。

診断項目はクラスターの構成によって異なり、実際のクラスター設定を反映します。

診断カテゴリ

カテゴリ	説明
Pod	Pod のステータス、イメージのプル、ネットワーク接続など、一般的な Pod の問題を診断します。
ノード	ノードのステータス、ネットワークステータス、カーネルログ、コアプロセスのステータス、サービスの可用性など、一般的なノードの問題を診断します。
NodeComponent	ネットワークプラグインやストレージプラグインなど、コアノードコンポーネントのステータスを診断します。
ClusterComponent	API サービスの可用性、DNS の可用性、NAT ゲートウェイのステータスなど、一般的なクラスターの問題を診断します。
ECSControllerManager	ステータス、ネットワーク接続、オペレーティングシステム、ディスク I/O など、ECS インスタンスの一般的な問題を診断します。

Pod

パラメータ	説明	ソリューション
コンテナの再起動回数	Pod 内のコンテナが再起動した回数を確認します。	Pod のステータスとログを確認してください。詳細については、「Pod のトラブルシューティング」をご参照ください。
ブロックされたコンテナイメージのダウンロード	同じノード上の他の Pod でコンテナイメージのダウンロードがブロックされているかどうかを確認します。
イメージプルシークレットの有効性	Pod がイメージのプルに使用する Secret が有効かどうかを確認します。
Pod から CoreDNS Pod への接続性	Pod から CoreDNS Pod への接続性を確認します。	Pod から CoreDNS へのネットワーク接続を確認してください。
Pod から CoreDNS Service への接続性	Pod から CoreDNS Service への接続性を確認します。	Pod から CoreDNS へのネットワーク接続を確認してください。
Pod からホストネットワーク DNS サーバーへの接続性	Pod からホストネットワーク上の DNS サーバーへの接続性を確認します。	Pod からホストネットワーク上の DNS サーバーへの接続性を確認してください。
D 状態のコンテナプロセス	Pod 内のコンテナプロセスが D 状態 (割り込み不可能なスリープ) にあるかどうかを確認します。	D 状態のコンテナプロセスは、通常、ディスク I/O でスタックしています。ECS インスタンスを再起動してみてください。問題が解決しない場合は、チケットを送信してください。
Pod の初期化ステータス	Pod が正しく初期化されたかどうかを確認します。	Pod のステータスとログを確認してください。詳細については、「Pod のトラブルシューティング」をご参照ください。
Pod のスケジューリングステータス	Pod が正しくスケジューリングされたかどうかを確認します。	Pod のステータスとログを確認してください。詳細については、「Pod のトラブルシューティング」をご参照ください。

ノード

提案された修正を適用しても問題が解決しない場合は、ノードのログを収集し、チケットを送信してください。

診断項目	検出内容	修正方法
Kubernetes API サーバーへの接続エラー	ノードがクラスターの API サーバーに到達できるかどうかを検出します。接続が失われると、ノードはワークロードの割り当てを受信できなくなります。	ACK クラスターのトラブルシューティングクラスターの構成を確認します。詳細については、「」をご参照ください。
AUFS マウントのハング	ノードで AUFS マウントのハングが発生しているかどうかを検出します。	チケットを送信してください。
BufferIOError エラー	ノードカーネルに BufferIOError エラーが存在するかどうかを検出します。	チケットを送信してください。
cgroup リーク	cgroup リークが発生しているかどうかを検出します。cgroup リークは、モニタリングデータの収集を中断させ、コンテナの起動失敗を引き起こす可能性があります。	ノードにログインし、影響を受ける cgroup ディレクトリを削除します。
chronyd プロセスの異常な状態	chronyd プロセスが正常に実行されているかどうかを検出します。chronyd プロセスが異常な場合、クロック同期が中断され、時間に依存する操作に影響します。	`systemctl restart chronyd` を実行してプロセスを再起動します。
containerd によるイメージのプル	containerd ランタイムが期待どおりにイメージをプルできるかどうかを検出します。	ノードのネットワーク構成とイメージ設定を確認します。
containerd の状態	containerd ランタイムが実行中であるかどうかを検出します。	チケットを送信してください。
CoreDNS Pod の可用性	ノードが CoreDNS Pod の IP アドレスに到達できるかどうかを検出します。CoreDNS Pod に到達できない場合、このノード上のワークロードで DNS 名前解決の失敗が発生します。	ノードが CoreDNS Pod の IP アドレスにアクセスできるか確認します。詳細については、「CoreDNS Pod 間で DNS クエリの負荷が分散されない場合の対処方法」をご参照ください。
イメージの状態	イメージが破損していないかどうかを検出します。イメージが破損していると、コンテナを起動できません。	チケットを送信してください。
イメージの overlay2 の状態	イメージ内の overlay2 ファイルシステムが破損しているかどうかを検出します。	チケットを送信してください。
システム時刻	システムクロックが正確かどうかを検出します。	なし。
Docker コンテナの起動	Docker コンテナの起動に失敗しているかどうかを検出します。	チケットを送信してください。
Docker イメージのプル	ノードが期待どおりに Docker イメージをプルできるかどうかを検出します。	ノードのネットワーク構成とイメージ設定を確認します。
Docker の状態	Docker ランタイムが実行中であるかどうかを検出します。	チケットを送信してください。
Docker の起動時間	Dockerd の起動時間。	なし。
Docker ハングエラー	ノードで Docker ハングエラーが発生しているかどうかを検出します。Docker がハングすると、コンテナが応答を停止する可能性があります。	`systemctl restart docker` を実行して Docker を再起動します。
ECS インスタンスの存在	基盤となる ECS インスタンスが存在するかどうかを検出します。	ECS インスタンスの状態を確認します。詳細については、「ノードとノードプールに関するよくある質問」をご参照ください。
ECS インスタンスの状態	ECS インスタンスが正常な状態であるかどうかを検出します。	ECS インスタンスの状態を確認します。詳細については、「ノードとノードプールに関するよくある質問」をご参照ください。
Ext4FsError エラー	ノードカーネルに Ext4FsError エラーが存在するかどうかを検出します。	チケットを送信してください。
読み取り専用のノードファイルシステム	ノードのファイルシステムが読み取り専用になっているかどうかを検出します。これは通常、ディスク障害を示し、すべての書き込み操作をブロックするため、ワークロードに影響します。	`fsck` を実行してファイルシステムを修復し、ノードを再起動します。
ハードウェアクロック	ハードウェアクロックとシステムクロックが同期しているかどうかを検出します。2 分以上の差があると、コンポーネントエラーが発生する可能性があります。	`hwclock --systohc` を実行して、システム時刻をハードウェアクロックに同期します。
DNS	ノードでドメイン名を名前解決できるかどうかを検出します。	詳細については、「DNS のトラブルシューティング」をご参照ください。
カーネル oops エラー	ノードカーネルに oops エラーが存在するかどうかを検出します。これらは予期しないコードパスを示しており、不安定性の原因となる可能性があります。	チケットを送信してください。
カーネルバージョン	カーネルバージョンが古いかどうかを検出します。古いカーネルには既知の安定性の問題がある場合があります。	ノードカーネルを更新します。詳細については、「ノードとノードプールに関するよくある質問」をご参照ください。
DNS の可用性	ノードが kube-dns Service のクラスター IP に到達して、クラスターの DNS サービスを使用できるかどうかを検出します。	CoreDNS Pod の状態とログを確認します。詳細については、「DNS のトラブルシューティング」をご参照ください。
kubelet の状態	kubelet が正常に実行されているかどうかを検出します。kubelet が失敗すると、ノードは Pod を管理できなくなります。	ACK クラスターのトラブルシューティングkubelet のログを確認します。詳細については、「」をご参照ください。
kubelet の起動時間	kubelet の起動時間。	なし。
CPU 使用率	ノードの CPU 使用率が過度に高いかどうかを検出します。	なし。
メモリ使用率	ノードのメモリ使用率が過度に高いかどうかを検出します。	なし。
メモリの断片化	ノードにメモリの断片化が存在するかどうかを検出します。断片化は連続したメモリを減らし、ワークロードのパフォーマンスを低下させる可能性があります。	ノードにログインし、`echo 3 \> /proc/sys/vm/drop_caches` を実行してキャッシュを解放します。
スワップメモリ	スワップメモリが有効になっているかどうかを検出します。Kubernetes ではスワップを無効にする必要があります。有効にすると、kubelet が予期せず動作する原因となる可能性があります。	ノードにログインし、スワップメモリを無効にします。
ネットワークデバイスドライバーの読み込み	ネットワークデバイス上の VirtIO ドライバーが正しく読み込まれているかどうかを検出します。	チケットを送信してください。
ノードの CPU 使用率が過度に高い	過去 1 週間で CPU 使用率が高かったかどうかを検出します。CPU 使用率が一貫して高いノードに多くの Pod がスケジューリングされると、リソースの競合によりサービスが中断される可能性があります。	ノードに過負荷がかからないように、リソースリクエストとリミットを適切に設定します。
ノードのプライベート IP の存在	ノードにプライベート IP アドレスが割り当てられているかどうかを検出します。プライベート IP がないと、ノードはクラスター内で通信できません。	クラスターからノードを削除し、再度追加します。ノードを削除する際に ECS インスタンスを解放しないでください。詳細については、「ノードの削除」および「既存の ECS インスタンスの追加」をご参照ください。
ノードのメモリ使用率が過度に高い	過去 1 週間でメモリ使用率が高かったかどうかを検出します。高いメモリ使用率と大量の Pod スケジューリングが組み合わさると、メモリ不足 (OOM) エラーやサービスの中断が発生する可能性があります。	ノードに過負荷がかからないように、リソースリクエストとリミットを適切に設定します。
ノードの状態	ノードが Ready 状態であるかどうかを検出します。	ノードを再起動します。詳細については、「ノードとノードプールに関するよくある質問」をご参照ください。
ノードのスケジューリング可否	ノードがスケジューリング不可とマークされているかどうかを検出します。スケジューリング不可のノードは、新しい Pod の割り当てを受け取りません。	ノードのスケジューリング構成を確認します。詳細については、「ノードのドレインとスケジューリングステータス」をご参照ください。
OOM エラー	ノードでメモリ不足 (OOM) エラーが発生しているかどうかを検出します。OOM エラーにより、Pod やシステムプロセスが強制終了される可能性があります。	チケットを送信してください。
ランタイムのチェック	ノードのコンテナランタイムがクラスターで設定されたランタイムと一致するかどうかを検出します。不一致があると、Pod の起動に失敗する可能性があります。	詳細については、「クラスターのコンテナランタイムを containerd から Docker に変更できますか？」をご参照ください。
古い OS バージョン	ノードの OS バージョンに既知のバグや安定性の問題があるかどうかを検出します。古い OS バージョンは、Docker および containerd ランタイムの誤動作を引き起こす可能性があります。	OS バージョンを更新します。
インターネットアクセス	ノードがインターネットに到達できるかどうかを検出します。	クラスターで SNAT が有効になっているか確認します。詳細については、「既存の ACK クラスターがインターネットにアクセスできるようにする」をご参照ください。
RCUStallError エラー	ノードカーネルに RCUStallError エラーが存在するかどうかを検出します。これらのエラーは、CPU コアが read-copy-update (RCU) クリティカルセクションでスタックしていることを示し、ノードがハングする原因となる可能性があります。	チケットを送信してください。
OS バージョン	ノードで使用されている OS バージョン。古い OS バージョンは、クラスターが正常に動作するのを妨げる可能性があります。	なし。
runc プロセスリーク	runc プロセスリークが発生しているかどうかを検出します。runc プロセスリークにより、ノードが定期的に NotReady 状態になる可能性があります。	リークした runc プロセスを特定し、手動で終了します。
SoftLockupError エラー	ノードカーネルに SoftLockupError エラーが存在するかどうかを検出します。これらは、CPU コアが割り込みに応答していないことを示し、ノードの不安定性の原因となる可能性があります。	チケットを送信してください。
systemd ハング	systemd ハングが発生しているかどうかを検出します。ハングした systemd は、サービスの起動または停止を妨げ、ノードの安定性に影響を与える可能性があります。	ノードにログインし、`systemctl daemon-reexec` を実行して systemd を再起動します。
古い systemd バージョン	systemd バージョンに既知のバグがあるかどうかを検出します。古いバージョンは、Docker と containerd の誤動作を引き起こす可能性があります。	systemdsystemd のバージョンを更新します。詳細については、「」をご参照ください。
ハングしたプロセス	ノードにハングしたプロセスが存在するかどうかを検出します。ハングしたプロセスは進捗なくリソースを消費し、ノードのパフォーマンスを低下させます。	チケットを送信してください。
unregister_netdevice エラー	ノードカーネルに unregister_netdevice エラーが存在するかどうかを検出します。これらはカーネルリソースリークやネットワークの不安定性を引き起こす可能性があります。	チケットを送信してください。

NodeComponent

診断項目	検出内容	修正
CNI コンポーネントのステータス	コンテナネットワークインターフェース (CNI) プラグインが期待どおりに実行されているかどうか。CNI プラグインが失敗すると、ノード上の Pod ネットワークが停止します。	クラスターのネットワークコンポーネントのステータスを確認してください。詳細については、「ネットワーク管理に関するよくある質問」をご参照ください。
CSI コンポーネントのステータス	コンテナストレージインターフェース (CSI) プラグインが期待どおりに実行されているかどうか。CSI プラグインが失敗すると、Pod はボリュームをマウントできなくなります。	クラスターのストレージコンポーネントのステータスを確認してください。詳細については、「CSI に関するよくある質問」をご参照ください。

ClusterComponent

診断項目	検出内容	修正
aliyun-acr-credential-helper のバージョン	aliyun-acr-credential-helper コンポーネントのバージョンが古いかどうか。	aliyun-acr-credential-helper を更新してください。詳細については、「aliyun-acr-credential-helper コンポーネントを使用して Secret なしでイメージをプルする」をご参照ください。
API Service の可用性	クラスターの API Service が利用可能かどうか。利用不可能な API Service は、ワークロード管理操作をブロックします。	`kubectl get apiservice` を実行して可用性を確認してください。利用不可能な場合は、`kubectl describe apiservice` を実行して原因を特定してください。
利用可能な Pod CIDR ブロックの不足	Flannel クラスターで利用可能な Pod CIDR ブロックの数が 5 未満であるかどうか。各ノードには 1 つの Pod CIDR ブロックが必要であり、すべてのブロックが使用されると、新しいノードはクラスターに参加できません。	チケットを送信してください。
CoreDNS エンドポイント	アクティブな CoreDNS エンドポイントの数。エンドポイントが少なすぎると、DNS の可用性が低下します。	CoreDNS Pod のステータスとログを確認してください。詳細については、「DNS のトラブルシューティング」をご参照ください。
CoreDNS クラスター IP アドレス	クラスター IP アドレスが CoreDNS Pod に割り当てられているかどうか。クラスター IP がないと、DNS リクエストは CoreDNS に到達できず、サービス全体の DNS 障害を引き起こします。	CoreDNS Pod のステータスとログを確認してください。詳細については、「DNS のトラブルシューティング」をご参照ください。
NAT ゲートウェイのステータス	クラスターの NAT ゲートウェイが正常に機能しているかどうか。NAT ゲートウェイが失敗すると、パブリック IP を持たないノードからのアウトバウンドインターネットトラフィックがブロックされます。	NAT Gateway コンソールにログインし、支払い遅延によりゲートウェイがロックされていないか確認してください。
NAT ゲートウェイでの同時接続ドロップ率が過度に高い	NAT ゲートウェイが異常に高いレートで同時接続をドロップしているかどうか。高いドロップ率は、ゲートウェイが接続容量に達したことを示します。	NAT ゲートウェイをアップグレードするには、「標準インターネット NAT ゲートウェイから高可用性インターネット NAT ゲートウェイへのアップグレードに関するよくある質問」をご参照ください。

ECSControllerManager

診断項目	検出内容	修正
ECS インスタンスコンポーネントに関連する支払い遅延	支払い遅延により、インスタンスのディスクまたはネットワーク帯域幅が制限されているかどうか。リソースが制限されると、ワークロードの障害が発生する可能性があります。	アカウントにチャージしてアクセスを復元してください。
ECS インスタンスに関連する支払い遅延	従量課金制の ECS インスタンスが支払い遅延により一時停止されているかどうか。	アカウントにチャージしてから、インスタンスを再起動してください。
ECS インスタンスの NIC ステータス	インスタンスのネットワークインターフェースカード (NIC) が正常に機能しているかどうか。NIC が異常な場合、ネットワーク接続が失われます。	インスタンスを再起動してください。
ECS インスタンスの起動ステータス	インスタンスが正常に起動できるかどうか。	起動に失敗した場合は、新しいインスタンスを作成してください。
ECS インスタンスのバックエンド管理システムのステータス	インスタンスのバックエンド管理システムが正常に動作しているかどうか。	インスタンスを再起動してください。
ECS インスタンスの CPU のステータス	インスタンスの基盤レイヤーで CPU 競合または CPU バインディングの失敗が存在するかどうか。CPU 競合は、インスタンスが CPU リソースを取得できなくなり、パフォーマンスを低下させる可能性があります。	インスタンスを再起動してください。
ECS インスタンスの CPU のスプリットロック	ECS インスタンスの CPU でスプリットロックが発生しているかどうか。スプリットロックは CPU パフォーマンスを著しく低下させる可能性があります。	詳細については、「スプリットロックの検出と対処」をご参照ください。
ECS インスタンスの DDoS 対策のステータス	インスタンスのパブリック IP アドレスが DDoS 攻撃を受けているかどうか。	Anti-DDoS サービスを購入してください。詳細については、「Alibaba Cloud Anti-DDoS ソリューションの比較」をご参照ください。
クラウドディスクの読み書き能力の制限	クラウドディスクの読み書きスループットがスロットリングされているかどうか。スロットリングは最大 IOPS に達したときに発生し、I/O 操作が遅くなったりキューに入ったりする原因となります。	詳細については、「ブロックストレージのパフォーマンス」をご参照ください。
ECS インスタンスディスクの読み込み	インスタンスの起動時にクラウドディスクをアタッチできるかどうか。	インスタンスを停止してから再度起動してください。
ECS インスタンスの有効期限切れ	サブスクリプションインスタンスの有効期限が切れているかどうか。期限切れのインスタンスは停止され、そのリソースは利用できなくなります。	インスタンスを更新します。詳細については、「サブスクリプションインスタンスを更新する」をご参照ください。
ECS インスタンスの OS クラッシュ	過去 48 時間以内に OS のクラッシュが発生したかどうか。	システムログを確認して原因を特定してください。詳細については、「システムログとスクリーンショットの表示」をご参照ください。
ECS インスタンスホストのステータス	インスタンスをホストしている物理サーバーに障害があるかどうか。ホストの障害はインスタンスのパフォーマンスを低下させる可能性があります。	インスタンスを再起動してください。
ECS インスタンスイメージの読み込み	インスタンスが初期化中にイメージを読み込めるかどうか。	インスタンスを再起動してください。
ECS インスタンスディスクの I/O ハング	システムディスクで I/O ハングが発生しているかどうか。ディスク I/O のハングは、オペレーティングシステムが応答しなくなる原因となる可能性があります。	ディスクメトリックを確認してください。詳細については、「クラウドディスクのモニタリングデータの表示」をご参照ください。Alibaba Cloud Linux 2 については、「ファイルシステムとブロックレイヤーの I/O ハングの検出」をご参照ください。
ECS インスタンスの帯域幅上限	インスタンスの総帯域幅がインスタンスタイプの上限に達しているかどうか。上限に達すると、ネットワークスループットが制限され、パケットがドロップされる可能性があります。	より高い帯域幅を持つインスタンスタイプにアップグレードしてください。詳細については、「インスタンス構成変更の概要」をご参照ください。
ECS インスタンスのバースト帯域幅の上限	インスタンスのバースト帯域幅がインスタンスタイプで許可されている最大値を超えているかどうか。	より高い帯域幅を持つインスタンスタイプにアップグレードしてください。詳細については、「インスタンス構成変更の概要」をご参照ください。
ECS インスタンス NIC の読み込み	インスタンス上で NIC を読み込めるかどうか。NIC の読み込みに失敗すると、インスタンスはネットワーク接続を失います。	インスタンスを再起動してください。
ECS インスタンスでの NIC セッション確立	NIC へのセッションを確立できるかどうか。NIC がセッションを確立できない、またはセッション制限に達した場合、ネットワーク接続やスループットに影響が出ます。	インスタンスを再起動してください。
ECS インスタンスでの主要な操作	インスタンスに対する最近の操作 (起動、停止、アップグレードなど) が正常に完了したかどうか。	失敗した操作を再試行してください。
ECS インスタンス NIC でのパケット損失	NIC でインバウンドまたはアウトバウンドのパケット損失が発生しているかどうか。パケット損失はネットワークエラーを引き起こし、サービスを中断させる可能性があります。	インスタンスを再起動してください。
ECS インスタンスのパフォーマンス低下	ソフトウェアまたはハードウェアの問題により、インスタンスのパフォーマンスが一時的に低下しているかどうか。	インスタンスの履歴イベントまたはシステムログを表示して原因を特定してください。詳細については、「履歴システムイベントの表示」をご参照ください。
ECS インスタンスのパフォーマンス低下	インスタンスのパフォーマンスが低下しているかどうか。CPU クレジットが不足すると、バーストパフォーマンスインスタンスはベースラインパフォーマンスにフォールバックします。	利用可能な CPU クレジットが不足しているため、ECS インスタンスはベースラインパフォーマンスしか提供できません。
ECS インスタンスのディスクサイズ変更	ディスクのサイズが変更されたが、OS がまだファイルシステムを拡張していないかどうか。ファイルシステムがサイズ変更されるまで、追加のディスク領域は利用できません。	ディスクのサイズ変更後、OS は自動的にファイルシステムをサイズ変更しません。ディスクがまだ使用できない場合は、再度サイズ変更してください。
ECS インスタンスのリソース申請	インスタンスに十分な物理 CPU およびメモリリソースが利用可能かどうか。リソースが不足している場合、インスタンスは起動できません。	数分待ってから、インスタンスの起動を再試行してください。問題が解決しない場合は、別のリージョンでインスタンスを作成してください。
ECS インスタンスの OS ステータス	インスタンスの OS でカーネルパニック、OOM エラー、または内部障害が発生したかどうか。これらは、設定の誤りやユーザープログラムによって引き起こされることがよくあります。	インスタンスを再起動してください。
ECS インスタンスの仮想化ステータス	基盤となる仮想化レイヤーに例外が存在するかどうか。これらは、インスタンスが応答しなくなったり、予期せず一時停止されたりする原因となる可能性があります。	インスタンスを再起動してください。