Cloud Monitor インフラストラクチャモニタリング・オペレーティングシステムモニタリング - Cloud Monitor

ECS には、インフラストラクチャモニタリング (エージェントレス、ホストから収集) とオペレーティングシステムモニタリング (エージェントベース、CloudMonitor エージェントが OS 内部から収集) の 2 種類のホストメトリックがあります。本トピックでは、両タイプの違い、収集方法、およびメトリックの定義について説明します。

インフラストラクチャモニタリングとオペレーティングシステムモニタリングの違い

比較項目	インフラストラクチャモニタリング	オペレーティングシステムモニタリング
監視場所	仮想化スタック	仮想マシンのオペレーティングシステム内部
収集頻度	1 分ごと	1 秒ごと
集計出力	なし	データを 1 秒ごとにサンプリングし、15 秒ごとに 1 つのデータポイントに集計します。最小値 (min)、平均値 (avg)、最大値 (max) の 3 つのメトリックが生成されます。
インストール要件	プローブは不要です。すぐに使用できます。	CloudMonitor エージェントのインストールが必要です。
メリット	追加のリソースオーバーヘッドがありません。適用範囲が広く、インスタンス上で実行される高負荷ワークロードの影響を受けません。	データ精度が高くなります。プロセスと関連付けることで、「スティールタイム」などの問題を診断できます。
デメリット	精度が低く、CPU の瞬間的な変動を検出できません。特定のプロセスのオーバーヘッドと関連付けることができません。	インストールとメンテナンスが必要です。リソースオーバーヘッドが発生します。仮想マシン (VM) がハングした場合や、起動・シャットダウン時に問題が発生した場合、データが失われる可能性があります。
代表的なシナリオ	VM の実行状態の影響を受けません。インスタンスのハングや障害の診断に適していますが、サンプリング頻度が低いため、急激なパフォーマンススパイクの検出には限界があります。	アプリケーションパフォーマンスの診断、リアルタイム監視、およびアラート。

FAQ：インフラストラクチャモニタリングとオペレーティングシステムモニタリングの間で、データ (接続数や CPU 使用率など) が一致しないのはなぜですか? どちらを信頼すべきですか?

2 つの監視タイプ間でデータが一致しないことは、想定される正常な動作です。この違いは、次の 3 つの要因から生じます。

収集の視点：インフラストラクチャモニタリングはホスト (ハイパーバイザーレベル) からデータを収集するのに対し、オペレーティングシステムモニタリングは CloudMonitor エージェントを介して ECS インスタンス内部からデータを収集します。
収集頻度：インフラストラクチャモニタリングは 1 分間隔で収集し、平均値のみを提供します。オペレーティングシステムモニタリングはデータを 1 秒ごとにサンプリングし、15 秒ごとに集計するため、より細かい粒度で最大値、最小値、平均値を提供します。
統計方法： 2 つの監視タイプは異なる統計方法を使用するため、同じ基盤リソースに対して異なる値が生成されます。

インスタンス内部のパフォーマンス問題をトラブルシューティングする場合や、正確なアラートしきい値を設定する場合は、オペレーティングシステムモニタリングデータを使用することを推奨します。オペレーティングシステムモニタリングは、より細かい粒度とより正確なインスタンス内部のステータスを提供します。

FAQ： ECS の CPU またはメモリのアラートルールを設定する場合、インフラストラクチャモニタリングとオペレーティングシステムモニタリングのどちらのメトリックを使用すべきですか?

選択は、監視要件によって異なります。

オペレーティングシステムモニタリングメトリック ((Agent) プレフィックス付き)：高精度の監視、プロセスレベルの診断、またはリアルタイムアラートが必要な場合に推奨されます。インスタンスに CloudMonitor エージェントをインストールする必要があります。より正確なインスタンス内部のリソースステータスを提供します。
インフラストラクチャモニタリングメトリック ((ECS) プレフィックス付き)：エージェント不要の基本的なリソース概要、またはインスタンスのダウンタイムや無応答 (ハング) インスタンスシナリオの診断に適しています。

ほとんどの場合、より正確で詳細なインスタンス内部のステータスを得るために、オペレーティングシステムモニタリングメトリックを使用することを推奨します。

インフラストラクチャモニタリング

ECS は、ホストからインスタンスメトリックを収集します。OS レベルのプラグインをインストールする必要はありません。

収集とレポート

ホストプローブは 1 分ごとに 1 つのデータポイントを収集します。これはその間隔の平均値を表します。

メトリック

インフラストラクチャモニタリングメトリックは、1 分間隔で収集されます。

説明

1 分の粒度では、最大値、最小値、平均値は同一です。

メトリック名	説明	単位	MetricName	ディメンション	統計
(ECS) CPU 使用率	CPU 使用率	%	CPUUtilization	userId, instanceId	最大値、最小値、平均値
(ECS) インバウンドインターネット帯域幅 (クラシックネットワーク)	インバウンドインターネットトラフィックの平均レート	bit/s	InternetInRate	userId, instanceId	最大値、最小値、平均値
(ECS) インバウンドプライベートネットワーク帯域幅	インバウンドプライベートネットワークトラフィックの平均レート	bit/s	IntranetInRate	userId, instanceId	最大値、最小値、平均値
(ECS) アウトバウンドインターネット帯域幅 (クラシックネットワーク)	アウトバウンドインターネットトラフィックの平均レート	bit/s	InternetOutRate	userId, instanceId	最大値、最小値、平均値
(ECS) アウトバウンドプライベートネットワーク帯域幅	アウトバウンドプライベートネットワークトラフィックの平均レート	bit/s	IntranetOutRate	userId, instanceId	最大値、最小値、平均値
(ECS) 全ディスクの読み取り BPS	全ディスクから 1 秒あたりに読み取られた合計バイト数	Byte/s	DiskReadBPS	userId, instanceId	最大値、最小値、平均値
(ECS) 全ディスクの書き込み BPS	全ディスクに 1 秒あたりに書き込まれた合計バイト数	Byte/s	DiskWriteBPS	userId, instanceId	最大値、最小値、平均値
(ECS) 全ディスクの読み取り IOPS	全ディスクの読み取り IOPS	counts/s	DiskReadIOPS	userId, instanceId	最大値、最小値、平均値
(ECS) 全ディスクの書き込み IOPS	全ディスクの書き込み IOPS	counts/s	DiskWriteIOPS	userId, instanceId	平均値、最小値、最大値
(ECS) IP アドレス別のインバウンドインターネット帯域幅	インバウンドインターネット帯域幅	bit/s	VPC_PublicIP_InternetInRate	userId, instanceId, ip	最大値、最小値、平均値
(ECS) IP アドレス別のアウトバウンドインターネット帯域幅	アウトバウンドインターネット帯域幅	bit/s	VPC_PublicIP_InternetOutRate	userId, instanceId, ip	最大値、最小値、平均値
(ECS) IP アドレス別のアウトバウンドインターネット帯域幅使用率	アウトバウンドインターネット帯域幅使用率	%	VPC_PublicIP_InternetOutRate_Percent	userId, instanceId, ip	平均値
(ECS) インバウンドインターネットトラフィック (クラシックネットワーク)	インバウンドインターネットトラフィック	Byte	InternetIn	userId, instanceId	平均値、最小値、最大値、合計
(ECS) アウトバウンドインターネットトラフィック (クラシックネットワーク)	アウトバウンドインターネットトラフィック	Byte	InternetOut	userId, instanceId	最大値、最小値、平均値

インフラストラクチャモニタリングデータの表示

CloudMonitor コンソールにログインします。
左側のナビゲーションウィンドウで、クラウドリソースの監視 > ホスト監視 を選択します。
ホスト監視 ページで、ターゲットインスタンスの名前をクリックするか、操作列の モニタリングチャート をクリックします。
[基本モニタリング] タブをクリックします。

[基本モニタリング] タブでは、インフラストラクチャモニタリングデータを表示できます。また、ホストのアラートルールを作成したり、アラートを表示したりすることもできます。

オペレーティングシステムのモニタリング

CloudMonitor は、Alibaba Cloud のホスト (ECS インスタンス) および Alibaba Cloud 以外のホストにインストールされた CloudMonitor エージェントを使用して、OS レベルのメトリックを収集します。これらのメトリックに対してアラートルールを設定できます。メトリックがアラートルールをトリガーすると、CloudMonitor は速やかに問題に対処できるようアラート通知を送信します。

前提条件

Alibaba Cloud ホスト (ECS インスタンス) および Alibaba Cloud 以外のホストにCloudMonitor エージェントをインストールしたことを確認してください。

収集とレポート

CloudMonitor のホストプローブは 1 秒に 1 回データをサンプリングし、15 秒ごとに 1 つのデータポイントに集約します。各データポイントは、min、max、avg の 3 つの値を含みます。

メトリクス

15 秒ごとに収集される OS 監視メトリクスは、以下のように分類されます：

説明

CloudMonitor では、トラフィック量にはバイナリ (1024 を基数とする) 単位を使用します。MiB はメビバイト (1 MiB = 1,024 × 1,024 バイト) を表します。大文字の B はバイト (Byte) を示します。帯域幅の単位は bit/s (ビット/秒) です。換算の参考：

1 MiB = 1,048,576 バイト
1 バイト = 8 ビット

CPU 関連のメトリック

Windows

ntdll の NtQuerySystemInformation 関数を呼び出して、CPU の各部分が費やした時間を取得します。この関数を一定の間隔で 2 回呼び出すことで、その間隔中に CPU の各部分が費やした時間のパーセンテージを計算できます。
Linux

次の表のメトリックは、top コマンドの出力に対応しています。

メトリック名	説明	単位	MetricName	ディメンション	統計	説明 (Linux のみ)
(エージェント) cpu.idle	アイドル状態の CPU のパーセンテージ。	%	cpu_idle	userId, instanceId	最大値、最小値、平均値	CPU がアイドル状態である時間のパーセンテージ。
(エージェント) cpu.system	カーネル空間で費やされた CPU 時間のパーセンテージ。	%	cpu_system	userId, instanceId	最大値、最小値、平均値	システムコンテキストスイッチによるオーバーヘッド。値が高い場合は、プロセスまたはスレッドが過剰であることを示します。
(エージェント) cpu.user	ユーザー空間で費やされた CPU 時間のパーセンテージ。	%	cpu_user	userId, instanceId	最大値、最小値、平均値	ユーザープロセスによる CPU 消費。
(エージェント) cpu.wait	I/O 操作の待機に費やされた CPU 時間のパーセンテージ。	%	cpu_wait	userId, instanceId	最大値、最小値、平均値	値が高い場合は、I/O 操作が頻繁に行われていることを示します。
(エージェント) cpu.other	他のタスクに費やされた CPU 時間のパーセンテージ。	%	cpu_other	userId, instanceId	最大値、最小値、平均値	その他の消費 = Nice + SoftIrq + Irq + Stolen。
(エージェント) cpu.total	CPU の合計使用率。	%	cpu_total	userId, instanceId	最大値、最小値、平均値	CPU 使用率 = 1 - Host.cpu.idle

説明

CloudMonitor の CPU 使用率メトリックには、I/O 待ち (wa) 時間が含まれます。アプリケーションが I/O 操作を待機してブロックされている場合、top または htop では特定の高 CPU プロセスが表示されないことがありますが、CloudMonitor の合計 CPU 使用率は、wa の値が高いため、より高い値になります。さらに、CloudMonitor はモニタリング間隔で収集された集計値 (最大値または平均値) を表示しますが、top はデフォルトでリアルタイムスナップショットを表示します。CloudMonitor の測定値と一致する一時的な CPU スパイクをキャプチャするには、top -d 0.5 を実行して更新頻度を上げてください。

メモリ関連のメトリック

Windows

kernel32.dll の GlobalMemoryStatusEx 関数を呼び出し、Windows オペレーティングシステムの物理メモリと仮想メモリの現在の使用状況を取得します。
Linux

次の表のメトリックは、free コマンドの出力に対応しています。データソースは /proc/meminfo です。

メトリック	説明	単位	MetricName	ディメンション	統計	説明 (Linux のみ)
(Agent) memory.total.space	合計メモリ。	Byte	memory_totalspace	userId, instanceId	最大値、最小値、平均値	サーバー上の合計メモリ容量。これは /proc/meminfo の MemTotal に対応します。
(Agent) memory.free.space	空きメモリの容量。	Byte	memory_freespace	userId, instanceId	最大値、最小値、平均値	システム内の利用可能なメモリ容量。これは /proc/meminfo の MemFree に対応します。
(Agent) memory.used.space	使用済みメモリの容量。	Byte	memory_usedspace	userId, instanceId	最大値、最小値、平均値	システム内の使用済みメモリ容量。計算方法： total - free。
(Agent) memory.actualused.space	ユーザーが消費したメモリの容量。	Byte	memory_actualusedspace	userId, instanceId	最大値、最小値、平均値	計算方法： /proc/meminfo に MemAvailable がある場合： total - MemAvailable /proc/meminfo に MemAvailable がない場合： used - buffers - cached 説明 CentOS 7.2 や Ubuntu 16.04 以降など、新しい Linux カーネルを使用するシステムでは、より正確にメモリを推定できます。MemAvailable の具体的な意味については、このコミットをご参照ください。
(Agent) memory.free.utilization	空きメモリの割合。	%	memory_freeutilization	userId, instanceId	最大値、最小値、平均値	計算方法： /proc/meminfo に MemAvailable がある場合： (MemAvailable / total) × 100%。 /proc/meminfo に MemAvailable がない場合： ((total - actualused) / total) × 100%。
(Agent) memory.used.utilization	メモリ使用率。	%	memory_usedutilization	userId, instanceId	最大値、最小値、平均値	計算方法： /proc/meminfo に MemAvailable がある場合： ((total - MemAvailable) / total) × 100%。 /proc/meminfo に MemAvailable がない場合： ((total - free - buffers - cached) / total) × 100%。

説明

CloudMonitor のメモリ使用率メトリック (memory.used.utilization) は、Buffers/Cache を除外しています。計算式は (Total − MemAvailable) / Total × 100% です (/proc/meminfo で MemAvailable が利用できる場合)。これは、従来の free コマンド出力 (「Used」の値にシステムキャッシュが含まれる) と比較して、実際に利用可能なメモリ量をより正確に反映します。CloudMonitor のメモリ使用率と free コマンドの出力に差異がある場合、これは仕様通りの動作です。

説明

CloudMonitor は現在、SWAP (スワップパーティション) 使用率メトリックを提供していません。SWAP のモニタリングが必要な場合は、次の代替手段をご検討ください。

物理メモリ使用率のモニタリング (memory.used.utilization)： SWAP は通常、物理メモリが不足している場合にのみ大量に使用されます。物理メモリ使用率をモニタリングすることで、通常はメモリプレッシャーを検出できます。
Simple Log Service (SLS) を使用したカスタム SWAP モニタリング： Simple Log Service (SLS) のホストログローカル収集機能を使用して、インスタンスから SWAP 使用状況情報を収集および集約します。

システムの平均負荷メトリック

Windows

該当するモニタリングメトリックはありません。
Linux

次の表のメトリックは、top コマンドの出力に対応しています。値が大きいほど、システムの負荷が高いことを示します。

メトリック名	説明	単位	MetricName	ディメンション	統計
(エージェント) load.1m	過去 1 分間のシステムの平均負荷。	なし	load_1m	userId, instanceId	最大、最小、平均
(エージェント) load.5m	過去 5 分間のシステムの平均負荷。	なし	load_5m	userId, instanceId	最大、最小、平均
(エージェント) load.15m	過去 15 分間のシステムの平均負荷。	なし	load_15m	userId, instanceId	最大、最小、平均
(エージェント) load.1m.percore	過去 1 分間の CPU コアあたりのシステムの平均負荷。	なし	load_per_core_1m	userId, instanceId	最大、最小、平均
(エージェント) load.5m.percore	過去 5 分間の CPU コアあたりのシステムの平均負荷。	なし	load_per_core_5m	userId, instanceId	最大、最小、平均
(エージェント) load.15m.percore	過去 15 分間の CPU コアあたりのシステムの平均負荷。	なし	load_per_core_15m	userId, instanceId	最大、最小、平均

ディスク関連のメトリック

Windows

まず、Kernel32.dll の GetDiskFreeSpaceExA 関数を呼び出して、利用可能なディスク領域を取得します。これにより、ディスクの使用済みストレージ容量、ディスク使用率、空きストレージ容量、合計ストレージ容量を取得できます。次に、RegConnectRegistryA 関数を呼び出して、HKEY_PERFORMANCE_DATA レジストリに接続します。最後に、RegQueryValueExA 関数を呼び出して、HKEY_PERFORMANCE_DATA レジストリからディスク関連のプロパティをクエリします。これらのプロパティには、読み取り回数、書き込み回数、書き込みバイト数、読み取りバイト数、読み取りに費やされた時間、書き込みに費やされた時間、ディスク使用時間が含まれます。
Linux

ディスク使用率と inode のメトリックは、df コマンドの出力に対応します。ディスクの読み取り/書き込みメトリックは、iostat コマンドの出力に対応します。

メトリック	説明	単位	MetricName	ディメンション	統計
Host.diskusage.used	使用済みディスクストレージ領域。	バイト	diskusage_used	userId, instanceId, device	最大値、最小値、平均値
Host.diskusage.utilization	一般ユーザーのディスク使用率。	%	diskusage_utilization	userId, instanceId, device	最大値、最小値、平均値
Host.diskusage.free	一般ユーザーおよびスーパーユーザー向けの空きディスクストレージ領域。	バイト	diskusage_free	userId, instanceId, device	最大値、最小値、平均値
(Agent) disk.usage.avail_device	一般ユーザー向けの空きディスクストレージ容量。	バイト	diskusage_avail	userId, instanceId, device	最大値、最小値、平均値
Host.diskusage.total	合計ディスクストレージ領域。	バイト	diskusage_total	userId, instanceId, device	最大値、最小値、平均値
(Agent) disk.read.bps_device	ディスクから 1 秒あたりに読み取られるバイト数。	Byte/s	disk_readbytes	userId, instanceId, device	最大値、最小値、平均値
(Agent) disk.write.bps_device	ディスクに 1 秒あたりに書き込まれるバイト数。	Byte/s	disk_writebytes	userId, instanceId, device	最大値、最小値、平均値
(Agent) disk.read.iops_device	ディスクへの 1 秒あたりの読み取りリクエスト数。	counts/s	disk_readiops	userId, instanceId, device	最大値、最小値、平均値
(Agent) disk.write.iops_device	ディスクへの 1 秒あたりの書き込みリクエスト数。	counts/s	disk_writeiops	userId, instanceId, device	最大値、最小値、平均値

ファイルシステムメトリック

Windows

指定されたモニタリングメトリックは存在しません。
Linux

次の表のメトリックは、df コマンドの出力に対応しています。

モニタリングメトリック名	説明	単位	MetricName	ディメンション	統計	説明 (Linux のみ)
(エージェント) fs.inode.utilization_device	inode 使用率	%	fs_inodeutilization	userId, instanceId, device	最大、最小、平均	Linux は inode 番号によってファイルを追跡します。すべての inode が割り当てられると、ディスク領域が残っていても新しいファイルは作成できません。多数の小さなファイルがあると、inode が枯渇する可能性があります。

説明

ホストモニタリングの「利用可能なディスク領域」メトリック (diskusage_free) には、ファイルシステムの予約ブロック領域 (予約ブロック数) が含まれます。その結果、この値は OS 内部で df などのコマンドによって表示される利用可能な領域とは異なる場合があります。これは想定内の動作です。特定のデバイス上の予約領域のサイズを確認するには、次のコマンドを実行します：

tune2fs -l <device>

ネットワーク関連のメトリクス

Windows

まず、iphlpapi.dll の GetAdaptersAddresses 関数を呼び出して、ローカルマシンのアダプターアドレスを取得します。次に、GetIfTable 関数を呼び出して、各インターフェイスのネットワークメトリクスを取得します。これらのメトリクスには、毎秒受信ビット数、毎秒送信ビット数、毎秒受信パケット数、毎秒送信パケット数、受信エラーパケット、および送信エラーパケットが含まれます。
Linux
- TCP 接続数は、ss コマンドの出力に対応します。
  
  説明
  TCP 接続数には、ECS ホスト上のすべての TCP 接続が含まれます。
  
  デフォルトでは、次の TCP 接続状態を収集します：TCP_TOTAL (合計接続数)、ESTABLISHED (ESTABLISHED 状態の接続)、および NON_ESTABLISHED (非確立状態の接続で、ESTABLISHED 以外のすべての状態が含まれます)。
- 次の表のネットワークトラフィックメトリクスは、/proc/net/dev ファイルから収集されたデータに対応します。

メトリクス名	説明	単位	MetricName	ディメンション	統計
(Agent) network.in.rate_device	インバウンド NIC 帯域幅 (毎秒受信ビット数)。	bit/s	networkin_rate	userId, instanceId, device	最大値、最小値、平均値
(Agent) network.out.rate_device	アウトバウンド NIC 帯域幅 (毎秒送信ビット数)。	bit/s	networkout_rate	userId, instanceId, device	最大値、最小値、平均値
(Agent) network.in.packages_device	NIC が毎秒受信するパケット数。	packets/s	networkin_packages	userId, instanceId, device	最大値、最小値、平均値
(Agent) network.out.packages_device	NIC が毎秒送信するパケット数。	packets/s	networkout_packages	userId, instanceId, device	最大値、最小値、平均値
(Agent) network.in.errorpackages_device	デバイスドライバーが検出した受信エラーパケット数。	packets/s	networkin_errorpackages	userId, instanceId, device	最大値、最小値、平均値
(Agent) network.out.errorpackages_device	デバイスドライバーが検出した送信エラーパケット数。	packets/s	networkout_errorpackages	userId, instanceId, device	最大値、最小値、平均値
(Agent) network.tcp.connection_state	さまざまな状態 (LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED など) の TCP 接続数。	カウント	net_tcpconnection	userId, instanceId, state	最大値、最小値、平均値

上位 4 件のプロセス関連メトリック

Windows
- クエリ
  
  まず、Kernel32.dll の OpenProcess 関数を呼び出してプロセスにアクセスします。GetProcessTimes 関数を一定間隔で 2 回呼び出して、CPU 使用率を計算します。次に、RegConnectRegistryA 関数を呼び出して HKEY_PERFORMANCE_DATA レジストリに接続します。最後に、RegQueryValueExA 関数を呼び出して、レジストリからプロセスプロパティを取得します。これらのプロパティには、プロセス ID、親プロセス ID、優先度、仮想メモリ、常駐メモリ、共有メモリ、プロセス名、オープンファイル数、スレッド数、ページフォールト、読み取りバイト数と書き込みバイト数が含まれます。
- プロセス数 (Host.process.number)
  - OpenProcess 関数を呼び出して、ターゲットプロセスを開きます。NTDLL の NtQueryInformationProcess 関数を呼び出して、RTL_USER_PROCESS_PARAMETERS 情報を取得します。ReadProcessMemory 関数を呼び出して、プロセスコマンドラインを取得します。この操作により、プロセス引数 (args) とそのルート実行パス (現在の作業ディレクトリ) を取得します。
  - OpenProcessToken 関数を呼び出して、アクセストークンハンドルを取得します。GetTokenInformation 関数を呼び出して、トークン情報を取得します。LookupAccountSid 関数を呼び出して、プロセスのユーザー名とユーザーグループを取得します。
  - 各プロセスについて、その引数 (args)、ルート実行パス、ユーザー名とユーザーグループをキーワードと照合します。一致が見つかった場合、カウンターを 1 増やします。
Linux
- プロセスの CPU とメモリのメトリックは、top コマンド出力に対応しています。CPU 使用率は、マルチコアの使用状況を反映します。
- Host.process.openfile は、lsof コマンド出力に対応しています。
- Host.process.number は、ps aux | grep '<keyword>' コマンド出力に対応しています。

メトリック	説明	単位	メトリック名	ディメンション	統計	備考
(Agent) process.cpu_pid	特定のプロセスが消費する CPU の割合。	%	process.cpu	userId, instanceId, name, pid	平均	アラート機能はサポートされていません。
(Agent) process.memory_pid	特定のプロセスが消費するメモリの割合。	%	process.memory	userId, instanceId, name, pid	平均	アラート機能はサポートされていません。
(Agent) process.openfile_pid	現在のプロセスが開いているファイルの数。	個	process.openfile	userId, instanceId, name, pid	平均	アラート機能はサポートされていません。
(Agent) process.count_processname	指定されたキーワードに一致するプロセスの数。	個	process.number	userId, instanceId, processName	平均	アラート機能はサポートされていません。

オペレーティングシステムモニタリングデータの表示

CloudMonitor コンソールにログインします。
左側のナビゲーションウィンドウで、クラウドリソースの監視 > ホスト監視 を選択します。
ホスト監視 ページで、ターゲットインスタンスの名前をクリックするか、操作列の モニタリングチャート をクリックします。

[OS モニタリング] タブでは、OS モニタリングデータを表示できます。また、ホストのアラートルールを作成するか、アラートを表示することもできます。

よくある質問：API を使用した ECS のメモリ使用量と CPU 使用率メトリクスの取得方法

使用する API は、モニタリングタイプによって異なります。

インフラストラクチャ監視メトリクス (vCPU 使用率など)：ECS API DescribeInstanceMonitorData を呼び出して、基本的なインスタンスレベルのメトリクスをクエリします。この API は CloudMonitor エージェントを必要としません。
OS レベルのメトリクス (メモリ使用量、CPU 使用率、システムロードアベレージなど)：
- ECS インスタンスに CloudMonitor エージェントがインストールされていることを確認してください (オペレーティングシステムのモニタリングに必要です)。
- CloudMonitor API DescribeMetricData または DescribeMetricList を呼び出して、エージェントメトリクスをクエリします。一般的なメトリック識別子には、以下のようなものがあります。
  - cpu_total — CPU 使用率
  - memory_usedutilization — メモリ使用率
  - load_5m — 5 分間のシステムロードアベレージ

Cloud Monitor:インフラストラクチャモニタリング・オペレーティングシステムモニタリング

インフラストラクチャモニタリングとオペレーティングシステムモニタリングの違い

インフラストラクチャモニタリング

収集とレポート

メトリック

インフラストラクチャモニタリングデータの表示

オペレーティングシステムのモニタリング

前提条件

収集とレポート

メトリクス

オペレーティングシステムモニタリングデータの表示

よくある質問：API を使用した ECS のメモリ使用量と CPU 使用率メトリクスの取得方法

関連ドキュメント