すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:Hadoop クラスター向け EMR Doctor の有効化

最終更新日:Mar 27, 2026

EMR Doctor は、オープンソースのビッグデータクラスターマネージャーであり、エンドツーエンドのインテリジェントな診断および最適化サービスを提供します。毎日のヘルスレポートの生成とリアルタイムスキャンを実行し、ワークロードに影響を与える前に問題を検出します。EMR V3.x(V3.41.0 より前)、V4.x、または V5.x(V5.6.0 より前)で実行される Hadoop クラスターの場合、Alibaba Cloud EMR Doctor チームへ有効化の申請が必要です。

DataLake クラスター、DataServing クラスター、およびカスタムクラスターでは、EMR Doctor がデフォルトで有効化されています。本トピックは、上記に示した Hadoop クラスターのバージョンにのみ適用されます。

前提条件

開始する前に、以下の条件を確認してください。

  • ご利用の Hadoop クラスターが、以下のいずれかのバージョンで実行されていること:

    • EMR V3.x(V3.41.0 より前)

    • EMR V4.x(すべてのマイナーバージョン)

    • EMR V5.x(V5.6.0 より前)

  • DingTalk グループ(グループ ID:44846846)に参加し、EMR Doctor チームと連絡を取れること。

EMR Doctor の仕組み

EMR Doctor は、クラスター内のコンピューティングタスクからメトリックおよびイベントを収集し、バックエンドで各タスクにスコアを付与します。これにより、以下の 2 種類の可視性が得られます。

  • 毎日のヘルスレポート:ストレージおよびコンピュートエンジンを分析し、クラスター全体のヘルスチェックを実行して、クラスターのヘルスステータスに関する毎日のレポートを生成します。

  • リアルタイムクラスターレポート:コンピューティングタスクおよびサービスを継続的にスキャンし、問題を検出し、運用・保守(O&M)担当者へトラブルシューティングのための通知を行います。

有効化による影響

EMR Doctor の有効化は、クラスター内で既に実行中のタスクには影響しません。EMR Doctor はタスクからメトリックおよびイベントのみを収集し、バックエンドで分析およびスコアリングを行います。インストールは、実行中およびキューに登録済みのタスクに対して透明です。

インストール時に適用される構成変更

EMR Doctor をインストールすると、自動的にクラスターのサービス構成ファイルに以下の設定が追加されます。

サービス構成ファイル追加されるパラメーター
Hivehive-env.sh環境変数
YARNmapred-site.xmlyarn.app.mapreduce.am.command-opts, mapreduce.map.java.opts, mapreduce.reduce.java.opts-noverify -javaagent:/usr/lib/taihaodoctor-current/emr-agent/btrace-agent.jar=libs=mr
YARNyarn-env.sh環境変数
Sparkspark-defaults.confspark.driver.extraJavaOptions, spark.executor.extraJavaOptions, spark.yarn.am.extraJavaOptions-noverify -javaagent:/usr/lib/taihaodoctor-current/emr-agent/btrace-agent.jar=libs=spark
Teztez-site.xmltez.task.launch.cmd-opts, tez.am.launch.cmd-opts-noverify -javaagent:/usr/lib/taihaodoctor-current/emr-agent/btrace-agent.jar=libs=mr,config=tez

保留中の構成

インストール中に、保存済みだがクラスターにまだ適用されていないサービス構成が Alibaba Cloud EMR から配信される場合があります。有効化前に、Hive、Spark、YARN、Tez の各サービスについて保留中の構成が存在しないか確認し、適用時の影響を評価してください。

インストール後のサービス再起動

インストール後に、以下のサービスを再起動します。

  • App Timeline Server

  • HiveServer2

  • Spark Thrift Server

再起動は、非ピーク時間帯またはメンテナンスウィンドウ内にスケジュールしてください。EMR Doctor はこれらの再起動なしでも動作しますが、一部のジョブ(例:MapReduce 上の Hive ジョブ)については、データが収集されない場合があります。

重要

Alibaba Cloud EMR Doctor チームより、インストール完了の連絡があり、再起動が必要なサービスが確認されます。

有効化の申請

クラスターの安定性を確保するため、Alibaba Cloud EMR Doctor チームがインストールをエンドツーエンドで対応します。

  1. DingTalk グループ(ID:44846846)に参加してください。EMR Doctor チームのエンジニアよりご連絡いたします。

  2. エンジニアがご利用のクラスターの状態を確認し、インストール実施のための時間帯を調整します。

  3. 合意した時間に、EMR Doctor チームが EMR Doctor をインストールします。

  4. インストール後、EMR コンソールにログインして、EMR Doctor の分析に基づいて生成されたレポートをご確認ください。

お問い合わせ

Alibaba Cloud EMR チームでは、本機能の有効化を支援する包括的なインストールサポートを提供しています。ご不明点やサポートが必要な場合は、DingTalk でグループ番号 44846846 を検索し、DingTalk グループに参加してください。担当エンジニアが割り当てられ、具体的な実施計画についてご相談いたします。

次のステップ