EMR Doctor的基本配置在安裝過程中已設定,主要控制叢集中繼資料和任務中繼資料的採集行為,通常情況下不需要修改和下發配置。本文為您介紹EMR Doctor的基本配置資訊以及如何修改基本配置。
本文為您列出了EMR Doctor中可以修改的配置。其餘配置請勿修改,否則會導致任務運行失敗等嚴重問題。
本文配置中的新版本叢集指的是資料湖(DataLake)和資料服務(DataServing)情境以及自訂叢集情境的叢集。舊版本叢集指的是舊版控制台的Hadoop叢集和Gateway叢集。
儲存中繼資料採集配置
配置名稱 | 預設配置 | 說明 |
collect.storage.enable | false | 是否採集儲存中繼資料,EMR Doctor預設不採集儲存中繼資料。 您可以在頁面手動開啟儲存資源資訊採集開關,開啟該配置。 |
collect.storage.intermediate.path | /mnt/disk1/log/doctor/derby/ | 儲存中繼資料採集過程產生的中間資料的路徑。 儲存中繼資料採集過程會產生中間資料,資料大小與FSImage成正比。 |
collect.storage.max.depth | 6 | 進階配置。儲存中繼資料遍曆目錄層深,包含從'/'開始的目錄層級。 說明 不建議您將該參數值修改的過大,過大可能會造成分析時間過長、中間儲存資料過大等問題。 |
collect.storage.top.size | 100 | 進階配置。儲存中繼資料每個層級擷取的top目錄個數,預設是每個層級擷取top100。 說明 不建議您將該參數值修改得過大,可能會造成分析時間過長、中間儲存資料過大等問題。 |
collect.oss.bucket | 無 | 被分析的Bucket名稱。 分析OSS資料時使用,相關功能請參見開通並配置OSS儲存分析。 |
collect.oss.manifest.dir | 無 | 資訊清單檔的目錄。 分析OSS資料時使用,相關功能請參見開通並配置OSS儲存分析。 |
您可以在EMR控制台TAIHAODOCTOR服務的配置頁面,查看或修改以上配置項。具體操作如下。
進入任意服務的配置頁面。
說明因為EMR Doctor是隱藏的服務,所以您需要修改相應連結才能訪問EMR Doctor。本文以HDFS為例。
在EMR控制台,單擊目的地組群操作列的叢集服務。
在叢集服務頁面,單擊HDFS地區的配置。
修改瀏覽器連結中的服務名稱為TAIHAODOCTOR。

替換服務名稱後,即可進入TAIHAODOCTOR服務的配置頁面。

在TAIHAODOCTOR服務配置頁面,您可以根據實際情況修改上述配置,然後儲存並生效配置。
修改配置項詳情,請參見修改配置項。
調度器採集配置
您可以在EMR控制台TAIHAODOCTOR服務的配置頁面,查看或修改以下配置項。修改以下配置的具體操作,請參見儲存中繼資料採集配置。
配置名稱 | 預設配置 | 說明 |
collect.job.interval | 120 | 對YARN調度的任務狀態進行採集,預設每120S採集一次。 |
collect.jobs.intermediate.path | /mnt/disk1/log/doctor/jobs/ | 儲存YARN調度任務狀態中間資料的路徑。 |
通用配置
您可以在EMR控制台TAIHAODOCTOR服務的配置頁面,查看或修改以下配置項。修改以下配置的具體操作,請參見儲存中繼資料採集配置。
配置名稱 | 預設配置 | 說明 |
collect.metrics.interval | 15 | 對引擎每個任務的Counters採集的時間間隔,預設每15S採集一次。 說明 不建議您將該參數值修改的過大或過小,過大會造成任務建議不準確,過小會造成採集的壓力過大,影響任務穩定性。 |
collect.rate.limit | 5000 | 流控配置,每個進程每秒最大採集的記錄條數。超過流控的資料會被直接丟棄,防止影響進程穩定性。 |
MR任務採集配置
您可以在EMR控制台YARN服務的配置頁面,查看或修改以下配置項。
修改配置項詳情,請參見修改配置項。
配置名稱 | 預設配置 | 說明 |
yarn.app.mapreduce.am.command-opts |
| 採集MR AppMaster中繼資料。
|
mapreduce.map.java.opts |
| 採集MR Map任務中繼資料。
|
mapreduce.reduce.java.opts |
| 採集MR Reduce任務中繼資料。
|
Tez任務採集配置
您可以在EMR控制台Tez服務的配置頁面,查看或修改以下配置項。
修改配置項詳情,請參見修改配置項。
配置名稱 | 預設配置 | 說明 |
tez.am.launch.cmd-opts |
| 採集Tez AppMaster中繼資料。 |
tez.task.launch.cmd-opts |
| 採集Tez Task中繼資料。 |
Spark任務採集配置
您可以在EMR控制台Spark服務的配置頁面,查看或修改以下配置項。
修改配置項詳情,請參見修改配置項。
配置名稱 | 預設配置 | 說明 |
spark.driver.extraJavaOptions |
| 採集Spark Driver中繼資料。
|
spark.executor.extraJavaOptions |
| 採集Spark Executor中繼資料。
|
YARN Timeline Server配置
您可以在EMR控制台YARN服務的配置頁面,查看或修改以下配置項。
修改配置項詳情,請參見修改配置項。
配置名稱 | 預設配置 | 說明 |
YARN_TIMELINESERVER_OPTS |
| 採集任務結束標誌。
|
