すべてのプロダクト
Search
ドキュメントセンター

ApsaraMQ for RocketMQ:ダッシュボード

最終更新日:Mar 12, 2026

ApsaraMQ for RocketMQ は、Managed Service for Prometheus および Grafana を活用した組み込みダッシュボードを提供します。これらのダッシュボードにより、メッセージスループット、コンシューマーラグ、処理遅延、クライアント側パフォーマンスをリアルタイムで可視化でき、異常の検出、配信問題のトラブルシューティング、容量計画を単一のビューから行えます。

ダッシュボードのメトリックは ARMS Prometheus Service の基本メトリックとして分類され、無料でご利用いただけます。

利用シーン

  • 消費の異常を検出:メッセージが蓄積し、コンシューマーが遅れています。コンシューマーラグおよび準備完了メッセージキュー時間にアラートを設定して、問題を早期に検知してください。

  • メッセージ配信をトレース:注文ステータスが更新されません。プロデューサーがメッセージを送信したか、コンシューマーが処理したかを、生成および消費メトリックを通じて確認します。

  • トラフィック傾向を分析:時間経過に伴うメッセージ量、スループット、サイズ分布を確認し、必要な容量を予測して成長に備えてください。

  • アプリケーション依存関係をマッピング:プロデューサーおよびコンシューマーの上流・下流トポロジーを調査し、アーキテクチャ変更の判断材料としてください。

前提条件

作業を開始する前に、以下の項目を確認してください。

  • ARMS Prometheus Service を有効化済みであること

  • 必要なサービスリンクロールを作成済みであること:詳細については、「サービスリンクロール」をご参照ください。

    プロパティ
    ロール名AliyunServiceRoleForOns
    ポリシー名AliyunServiceRolePolicyForOns
    権限ApsaraMQ for RocketMQ が CloudMonitor および ARMS にアクセスして、モニタリング、アラート機能、ダッシュボード機能を利用できるようにする権限

メッセージ蓄積の仕組み

次の図は、トピックキューにおけるメッセージのライフサイクルを示しています。

Queue message status

ApsaraMQ for RocketMQ は、各処理段階におけるメッセージ数およびメッセージの経過時間を追跡します。これらのメトリックにより、コンシューマーが受信メッセージに追いついているかどうかを把握できます。

メッセージ数メトリック

メトリック定義計算式
インフライトメッセージ現在コンシューマーによって処理中で、まだ消費結果が返されていないメッセージ最新プルメッセージのオフセット - 最新提出メッセージのオフセット
準備完了メッセージサーバー上に保存され、コンシューマーから見え、消費可能な状態のメッセージ最大メッセージオフセット - 最新プルメッセージのオフセット
コンシューマーラグ未処理メッセージの合計(インフライト + 準備完了)インフライトメッセージ数 + 準備完了メッセージ数

メッセージ持続時間メトリック

メトリック定義計算式
準備完了時刻メッセージが消費可能になる時点。通常メッセージおよび順序付きメッセージではストレージ時刻、スケジュールおよび遅延メッセージでは遅延の有効期限切れ時刻、トランザクションメッセージではトランザクションコミット時刻です。該当なし
準備完了メッセージキュー時間最も古い準備完了メッセージが待機している時間。コンシューマーがどのくらい迅速にメッセージをプルしているかを示します。現在時刻 - 最も古い準備完了メッセージの準備完了時刻
コンシューマーラグ時間応答待ちの最も古いメッセージが準備完了になってからの経過時間。コンシューマーがどのくらい迅速にメッセージを処理しているかを示します。現在時刻 - 応答待ちの最も古いメッセージの準備完了時刻

PushConsumer のローカル処理

PushConsumer は Reactor スレッドモデルを使用します。SDK は組み込みのロングポーリングスレッドを実行し、サーバーからメッセージをプルしてローカルバッファーキューに格納します。その後、消費スレッドプールがこのバッファーからメッセージを取得し、メッセージリスナーを呼び出します。

PushConsumer consumption flow

詳細については、「PushConsumer」をご参照ください。

ローカルバッファーの状態を追跡するクライアント側メトリックは以下の 3 つです。

  • キャッシュされたメッセージ数:現在ローカルバッファーキュー内にあるメッセージの総数。

  • キャッシュされたメッセージサイズ:ローカルバッファーキュー内の全メッセージの合計サイズ(バイト単位)。

  • 待機時間:各メッセージがローカルバッファーキュー内で消費開始まで待機する時間。

ダッシュボードの表示

ApsaraMQ for RocketMQ コンソールでは、以下の 4 つのエントリポイントからダッシュボードにアクセスでき、それぞれ異なる詳細レベルで情報を表示します。

エントリポイント表示内容
ダッシュボード ページインスタンス内のすべてのトピックおよびコンシューマーグループのメトリック
インスタンス詳細 ページプロデューサー概要、課金メトリック、速度制限メトリック
トピック詳細 ページ特定のトピックに関する生成メトリックおよびプロデューサークライアントメトリック
グループ詳細 ページ特定のグループに関するコンシューマーラグおよびコンシューマークライアントメトリック

ダッシュボードを開く手順は以下のとおりです。

  1. ApsaraMQ for RocketMQ コンソール にログインします。左側のナビゲーションウィンドウで、インスタンス をクリックします。

  2. 上部のナビゲーションバーで、中国 (杭州) などのリージョンを選択します。インスタンス ページで、対象のインスタンス名をクリックします。

  3. 以下のいずれかのエントリポイントからダッシュボードを開きます。

    • インスタンスレベルのダッシュボードインスタンス詳細 ページで、ダッシュボード タブをクリックします。

    • 専用ダッシュボードページ:左側のナビゲーションウィンドウで、ダッシュボード をクリックします。

    • トピックレベルのダッシュボード:左側のナビゲーションウィンドウで、トピック をクリックします。トピック名をクリック後、トピック詳細 ページの ダッシュボード タブをクリックします。

    • グループレベルのダッシュボード:左側のナビゲーションウィンドウで、グループ をクリックします。グループ名をクリック後、グループ詳細 ページの ダッシュボード タブをクリックします。

メトリックリファレンス

重要

TPS、API 呼び出し回数、メッセージ量のメトリックは、標準的な 4 KB の通常メッセージに基づいて計算されます。より大きなメッセージや高度な機能(順序付き、トランザクション、遅延)を使用するメッセージには、乗数が適用されます。計算ルールの詳細については、「計算仕様」をご参照ください。

メトリックタイプとラベル

メトリックタイプ

タイプ動作
カウンター単調増加する累積値生成されたメッセージの総数
ゲージ増減する可能性のある時点の値現在の TPS
ヒストグラム事前定義されたバケットにわたる値の分布メッセージサイズのディストリビューション

共通ラベル

ラベル説明
instance_idApsaraMQ for RocketMQ インスタンス ID
topicトピック名
consumer_groupコンシューマーグループ名
message_typenormalfifo(順序付き)、transaction、または delay(遅延/スケジュール)
fifo_enabletrue、同時配信の場合は false
uidAlibaba Cloud アカウント ID
client_idApsaraMQ for RocketMQ クライアント ID
invocation_statussuccess または failure

サーバー側メトリック

タイプメトリック名単位説明ラベル
ゲージrocketmq_instance_requests_maxcount/sインスタンスが送受信したすべてのメッセージのピーク TPS。速度制限されたリクエストは除外されます。1 分間のウィンドウ内で 1 秒あたりのサンプル 60 件の最大値です。uidinstance_id
ゲージrocketmq_instance_requests_in_maxcount/sインスタンスのピーク送信 TPS。速度制限されたリクエストは除外されます。1 分間で 1 秒あたりのサンプル 60 件の最大値です。uidinstance_id
ゲージrocketmq_instance_requests_out_maxcount/sインスタンスのピーク消費 TPS。速度制限されたリクエストは除外されます。1 分間で 1 秒あたりのサンプル 60 件の最大値です。uidinstance_id
ゲージrocketmq_topic_requests_maxcount/s特定のトピックのピーク送信 TPS。速度制限されたリクエストは除外されます。1 分間で 1 秒あたりのサンプル 60 件の最大値です。uidinstance_idtopic
ゲージrocketmq_group_requests_maxcount/sコンシューマーグループのピーク消費 TPS。速度制限されたリクエストは除外されます。1 分間で 1 秒あたりのサンプル 60 件の最大値です。uidinstance_idconsumer_group
ゲージrocketmq_instance_requests_in_thresholdcount/sインスタンスでのメッセージ送信に対する速度制限しきい値。uidinstance_id
ゲージrocketmq_instance_requests_out_thresholdcount/sインスタンスでのメッセージ消費に対する速度制限しきい値。uidinstance_id
ゲージrocketmq_throttled_requests_incount速度制限された送信リクエスト数。uidinstance_idtopicmessage_type
ゲージrocketmq_throttled_requests_outcount速度制限された消費リクエスト数。uidinstance_idtopicfifo_enableconsumer_group
ゲージrocketmq_instance_elastic_requests_maxcount/sインスタンスのピークエラスティック TPS。uidinstance_id
カウンターrocketmq_requests_in_totalcount送信 API 呼び出しの総数。uidinstance_idtopicmessage_type
カウンターrocketmq_requests_out_totalcount消費 API 呼び出しの総数。uidinstance_idtopicconsumer_groupfifo_enable
カウンターrocketmq_messages_in_totalmessageプロデューサーが送信したメッセージの総数。uidinstance_idtopicmessage_type
カウンターrocketmq_messages_out_totalmessageコンシューマーに配信されたメッセージの総数。処理中、正常終了、失敗したメッセージをすべて含みます。uidinstance_idtopicconsumer_groupfifo_enable
カウンターrocketmq_throughput_in_totalbyteプロデューサーからのインバウンドメッセージスループットの合計。uidinstance_idtopicmessage_type
カウンターrocketmq_throughput_out_totalbyteコンシューマーへのアウトバウンドメッセージスループットの合計。処理中、正常終了、失敗したメッセージをすべて含みます。uidinstance_idtopicconsumer_groupfifo_enable
カウンターrocketmq_internet_throughput_out_totalbyteメッセージ送受信時のダウンストリームインターネットトラフィック。uidinstance_idtopicmessage_type
ヒストグラムrocketmq_message_sizebyte正常に送信されたメッセージのサイズディストリビューション。バケット:le_1_kb(<=1 KB)、le_4_kb(<=4 KB)、le_512_kb(<=512 KB)、le_1_mb(<=1 MB)、le_2_mb(<=2 MB)、le_4_mb(<=4 MB)、le_overflow(>4 MB)。uidinstance_idtopicmessage_type
ゲージrocketmq_consumer_ready_messagesmessageコンシューマーがプルするのを待っているサーバー上の準備完了メッセージ。uidinstance_idtopicconsumer_group
ゲージrocketmq_consumer_inflight_messagesmessage現在コンシューマーによって処理中のメッセージ(結果がまだ返されていません)。uidinstance_idtopicconsumer_group
ゲージrocketmq_consumer_queueing_latencyms最も古い準備完了メッセージが待機している時間。プルの迅速性を示します。uidinstance_idtopicconsumer_group
ゲージrocketmq_consumer_lag_latencyms応答待ちの最も古いメッセージが準備完了になってからの経過時間。処理の迅速性を示します。uidinstance_idtopicconsumer_group
カウンターrocketmq_send_to_dlq_messagesmessage1 分あたりのデッドレターメッセージ数。メッセージは最大再配信試行回数を超えるとデッドレターになります。グループのデッドレターポリシーに基づき、これらのメッセージは指定されたトピックに保存されるか、破棄されます。uidinstance_idtopicconsumer_group
ゲージrocketmq_storage_sizebyteすべてのファイルを含む、インスタンスで使用されているストレージの合計サイズ。uidinstance_id

プロデューサーメトリック

タイプメトリック名単位説明ラベル
ヒストグラムrocketmq_send_cost_timems正常な送信 API 呼び出しの遅延ディストリビューション。バケット:le_1_msle_5_msle_10_msle_20_msle_50_msle_200_msle_500_msle_overflowuidinstance_idtopicclient_idinvocation_status

コンシューマーメトリック

タイプメトリック名単位説明ラベル
ヒストグラムrocketmq_process_timemsPushConsumer のメッセージ処理時間ディストリビューション(正常終了および失敗したメッセージを含む)。rocketmq_process_time = 処理終了時刻 - 処理開始時刻。バケット:le_1_msle_5_msle_10_msle_100_msle_10000_msle_60000_msle_overflowuidinstance_idconsumer_grouptopicclient_idinvocation_status
ゲージrocketmq_consumer_cached_messagesmessagePushConsumer のローカルバッファーキュー内のメッセージ。uidinstance_idconsumer_grouptopicclient_id
ゲージrocketmq_consumer_cached_bytesbytePushConsumer のローカルバッファーキュー内のメッセージの合計サイズ。uidinstance_idconsumer_grouptopicclient_id
ヒストグラムrocketmq_await_timemsメッセージが PushConsumer のローカルバッファーキュー内で処理開始まで待機する時間。rocketmq_await_time = 処理開始時刻 - 到着時刻。バケット:le_1_msle_5_msle_20_msle_100_msle_1000_msle_5000_msle_10000_msle_overflowuidinstance_idconsumer_grouptopicclient_id

課金

ダッシュボードのメトリックは ARMS Prometheus Service の基本メトリックとして分類されます。基本メトリックは無料です。ダッシュボード機能の利用に追加料金はかかりません。

詳細については、「基本メトリック」および「従量課金」をご参照ください。

よくある質問

ダッシュボードのメトリックデータにプログラムからアクセスするにはどうすればよいですか?

すべての ApsaraMQ for RocketMQ メトリックは、ご利用の Managed Service for Prometheus インスタンスに保存されます。データアクセスエンドポイントを取得する手順は以下のとおりです。

  1. ARMS コンソール にログインします。左側のナビゲーションウィンドウで、インテグレーションセンター をクリックします。

  2. RocketMQ を検索し、Alibaba Cloud RocketMQ (5.0) Service を選択します。「Alibaba Cloud サービスのモニタリングデータを統合する」に従って統合を完了します。

  3. プロビジョニングが完了したら、左側のナビゲーションウィンドウで、プロビジョニング をクリックします。

  4. クラウドサービスリージョン環境 タブをクリックし、対象の環境名をクリックします。

  5. コンポーネント管理 タブの 基本情報 エリアで、Prometheus インスタンス の横にあるクラウドサービスリージョンをクリックします。

  6. 設定項目 タブで、利用可能なデータアクセス方法(HTTP API エンドポイント、Remote Write など)を確認します。

メトリックをセルフマネージド Grafana に統合するにはどうすればよいですか?

上記の手順で HTTP API アドレスを取得したら、それを Grafana インスタンスの Prometheus データソースとして追加します。手順の詳細については、「HTTP API アドレスを使用して Prometheus データを Grafana に統合する」をご参照ください。

TPS Max とは何を表していますか?

TPS Max は、1 分間のウィンドウ内で測定されたトランザクション毎秒(TPS)のピーク値です。システムは 1 秒ごとに TPS をサンプリング(1 分間に 60 サンプル)し、その中で最も高い値を報告します。

:インスタンスが 1 分間に 4 KB の通常メッセージを 60 件送信した場合。

  • 最初の 1 秒で 60 件すべてを送信した場合、1 秒あたりの TPS = 60、0、0、...、0 となり、TPS Max = 60 です。

  • 最初の 1 秒で 40 件、次の 1 秒で 20 件を送信した場合、1 秒あたりの TPS = 40、20、0、...、0 となり、TPS Max = 40 です。