Data Transmission Service (DTS) は CloudMonitor と統合されています。CloudMonitor のイベントサブスクリプション機能を使用して、重要なイベントに対するカスタムアラート通知を構成できます。これにより、イベントの発生と進捗状況を迅速に通知され、ビジネス上の例外発生時に問題を迅速に分析し、トラブルシューティングするのに役立ちます。
背景情報
CloudMonitor は、インターネットアプリケーションと Alibaba Cloud リソースを監視するサービスです。CloudMonitor を構成して、システムの異常を通知させることができます。その後、アラート通知に基づいて異常処理プロセスを自動化できます。CloudMonitor は、次のアラート通知方法をサポートしています:
E メール、テキストメッセージ、または DingTalk チャットボットを使用してアラート通知を送信します。
イベントを Simple Message Queue (旧称:MNS)、Function Compute、Simple Log Service、または指定されたコールバック URL にプッシュします。これにより、ビジネス要件に基づいて異常処理プロセスを自動化できます。
前提条件
[ApsaraDB 障害またはメンテナンス通知] が有効になっており、Message Center コンソールで連絡先が指定されていること。連絡先として O&M エンジニアを指定することをお勧めします。
アラート連絡先とアラートグループを作成します。次に、アラート連絡先をアラートグループに追加します。詳細については、「アラート連絡先またはアラートグループの作成」をご参照ください。
サブスクリプションポリシーの作成
CloudMonitor コンソールにログインします。
左側のナビゲーションウィンドウで、 を選択します。
説明[イベントサブスクリプション] ページが表示されない場合は、「CloudMonitor コンソールで DTS タスクのアラートルールを設定する」をご参照ください。
[サブスクリプションポリシー] タブで、[サブスクリプションポリシーの作成] をクリックします。
[サブスクリプションポリシーの作成] ページで、サブスクリプションポリシーのパラメーターを設定します。
[サブスクリプションタイプ] を [システムイベント] に設定した場合、[サブスクリプション範囲] セクションで [プロダクト] を [データ伝送] に設定します。
説明DTS がサポートするシステムイベントの詳細については、「システムイベント」をご参照ください。
[サブスクリプションタイプ] を [閾値イベント] に設定した場合、[プロダクト分類] セクションで [Data Transmission Service] を検索し、必要に応じてオプションを選択します。
必要に応じて他のパラメーターを構成します。詳細については、「サブスクリプションポリシーのパラメーター」をご参照ください。
構成が完了したら、[送信] をクリックします。
サブスクライブした CloudMonitor イベントを表示、変更、または削除するには、「イベントサブスクリプションの管理 (推奨)」をご参照ください。
イベントサブスクリプションのデバッグ
CloudMonitor コンソールにログインします。
左側のナビゲーションウィンドウで、 を選択します。
説明[イベントサブスクリプション] ページが表示されない場合は、「CloudMonitor コンソールで DTS タスクのアラートルールを設定する」をご参照ください。
[サブスクリプションポリシー] タブで、[イベントサブスクリプションのテスト] をクリックします。
[イベントデバッグの作成] パネルで、デバッグイベントを構成します。
[プロダクト] を [データ伝送] に設定します。
必要に応じて [名前] を選択します。
説明[名前] は、システムイベントの [NameDesc] パラメーターです。
[基盤となるハードウェアのアップグレードによるタスクの再配置] シリーズまたは [インスタンスタスクのレイテンシ] イベントはデバッグできません。
システムは JSON 形式でデバッグコンテンツを自動的に生成します。
必要に応じてデバッグコンテンツを変更します。
コンテンツの変更方法の例については、「イベントコンテンツの例」をご参照ください。
[OK] をクリックします。
[操作は成功しました] というメッセージが表示されます。CloudMonitor は、サブスクリプションポリシーの通知方法に基づいて、テストアラート通知をアラート連絡先に自動的に送信します。
イベントコンテンツの例
同期、移行、追跡タスク
パラメーターの説明
パラメーター | 説明 | 値の例 |
product | システムイベントが属するクラウドプロダクト (プロダクト)。 |
|
resourceId | 影響を受けるリソース。 説明 値は |
|
level | システムイベントのレベル (レベル)。
|
|
instanceName | 影響を受けるインスタンスの名前。フォーマット: |
|
regionId | インスタンスのリージョン。 |
|
name | システムイベントの名前 (名前)。 |
|
content | システムイベントのコンテンツ。 |
|
msg | ||
status | システムイベントのステータス (ステータス)。
|
|
例
名前 | コンテンツの例 |
同期タスクの異常 | |
同期タスクの回復 | |
移行タスクの異常 | |
移行タスクの回復 | |
追跡タスクの異常 | |
追跡タスクの回復 | |
インスタンスタスク
パラメーターの説明
パラメーター | 説明 | 値の例 |
product | システムイベントが属するクラウドプロダクト (プロダクト)。 |
|
resourceId | 影響を受けるリソース。 説明 値は |
|
level | システムイベントのレベル (レベル)。 説明 インスタンスタスクの例外のレベルは常に WARN (警告) です。 |
|
instanceName | 影響を受けるインスタンスの名前。フォーマット: |
|
regionId | インスタンスのリージョン。 |
|
name | システムイベントの名前 (名前)。 |
|
content | システムイベントのコンテンツ。 |
|
eventId | システムイベントの ID。 |
|
publishTime | システムイベントが公開された時刻。時刻は UTC です。 |
|
reason | システムイベントがトリガーされた理由。 |
|
product | イベントが属するクラウドプロダクト。 |
|
instanceComment | 影響を受けるインスタンスの ID。 |
|
instanceId | ||
extra | システムイベントのコンテンツに関する追加情報。 |
|
eventTime | システムイベントの開始時刻。時刻は UTC です。 |
|
cloudEvent | CloudMonitor イベントに関する情報。 |
|
data | システムイベントのデータ概要。 |
|
gmtModified | 更新時刻。時刻は UTC です。 |
|
eventCategory | イベントの分類 (イベントタイプ)。 説明 インスタンスタスクの例外の分類は常に Exception です。 |
|
gmtCreated | イベントが作成された時刻。時刻は UTC です。 |
|
detailReason | イベントがトリガーされた詳細な理由。 |
|
uid | Alibaba Cloud アカウント ID。 |
|
cmsProduct | イベントが属するクラウドプロダクト。 |
|
instanceId | 影響を受けるインスタンスの ID。 |
|
eventLevel | イベントのレベル (レベル)。 説明 インスタンスタスクの例外のレベルは常に WARN (警告) です。 |
|
handleStatus | イベントの処理ステータス。 |
|
startTime | イベントの開始時刻。時刻は UTC です。 |
|
detailImpact | ページネーションパラメーター。 |
|
eventId | イベントの ID。 |
|
product | イベントが属するクラウドプロダクト。 |
|
dbType | ||
hasLifeCycle | イベントにライフサイクルがあるかどうかを示します。
|
|
eventType | イベントのタイプ。 |
|
eventReason | イベントのソース。 |
|
eventImpact | イベントの影響。 |
|
mainEventId | メインイベントの ID。 |
|
eventCode | イベントのコード。名前の値です。 |
|
isClosed | イベントがクローズされているかどうかを示します。
|
|
regionId | インスタンスのリージョン。 |
|
sourceType | ソースデータのタイプ。 |
|
eventStatus | システムイベントのステータス (ステータス)。
|
|
endTime | イベントの終了時刻。 |
|
eventDetail | イベントの詳細。詳細は、タスクタイプ (dts_task_type)、タスク ID (dts_job_id)、タスクステータス (job_state)、エラーコード (err_code)、およびタスク例外に関する詳細情報 (err_msg_detail および message) を含みます。 |
|
resourceType | リソースタイプ。
|
|
subject | 影響を受けるリソース。 説明 値は |
|
specversion | CloudEvents プロトコルのバージョン。 |
|
time | イベントが作成された時刻。時刻は UTC です。 |
|
source | イベントのソース。 |
|
id | イベントの ID。 |
|
region | インスタンスのリージョン。 |
|
type | イベントのタイプ。 |
|
region | インスタンスのリージョン。 |
|
instanceType | リソースタイプ。
|
|
eventType | イベントの分類。 |
|
status | システムイベントのステータス (ステータス)。
|
|
例
名前 | コンテンツの例 |
インスタンスタスク例外の回復 | |
インスタンスタスク例外の開始 | |
基盤となるハードウェアのアップグレードによるタスクの再配置
パラメーターの説明
パラメーター | 説明 | 値の例 |
product | システムイベントが属するクラウドプロダクト (プロダクト)。 |
|
userId | Alibaba Cloud アカウント ID。 |
|
level | システムイベントのレベル (レベル)。
|
|
resourceId | 影響を受けるリソース。 説明 値は |
|
instanceName | 影響を受けるインスタンスの名前。フォーマット: |
|
dryRun | プリフライトリクエストのみを実行するかどうかを示します。
|
|
ver | CloudEvents プロトコルのバージョン。 |
|
trace | リクエスト ID。 |
|
name | システムイベントの名前 (名前)。 |
|
regionId | インスタンスのリージョン。 |
|
status | システムイベントのステータス (ステータス)。
|
|
time | システムイベントが生成された時刻。 |
|
content | システムイベントのコンテンツ。 説明 コンテンツには、タスクまたはインスタンス名 (jobName)、システムイベントの推定実行時間 (innerScheduleTime)、インスタンス ID (instanceId)、インスタンスリージョン (region) などの情報を含めることができます。 |
|
例
名前 | コンテンツの例 |
基盤となるハードウェアのアップグレードによるタスクの再配置 (スケジュール済み) | |
基盤となるハードウェアのアップグレードによるタスクの再配置 (実行中) | |
基盤となるハードウェアのアップグレードによるタスクの再配置 (完了) | |
基盤となるハードウェアのアップグレードによるタスクの再配置 (失敗) | |
基盤となるハードウェアのアップグレードによるタスクの再配置 (キャンセル済み) | |
基盤となるハードウェアのアップグレードによるタスクの再配置 (顧客の操作待ち) | |