Kafka 版 ApsaraMQ は HouseKeeing と統合されており、検査機能を提供してクラスターを定期的にスキャンおよび診断し、異常なインスタンスに対してアラートを生成します。このトピックでは、Kafka 版 ApsaraMQ の検査機能について説明します。
概要
Kafka 版 ApsaraMQ のクラスターの安定性とサービスの信頼性を向上させるために、Kafka 版 ApsaraMQ 技術チームは検査機能を最適化しました。
メッセージング機能の秒単位での検査
検査機能を使用すると、内部トピックを使用してメッセージング機能をすばやく確認できます。依存コンポーネントにおけるメッセージングの失敗、レイテンシの増加、スループットの異常、接続例外などの問題が発生した場合、システムは Kafka 版 ApsaraMQ 技術チームにすぐにアラートを送信します。これにより、技術チームは問題に迅速に対応して解決し、ビジネスの継続性と安定性を確保できます。
トピックオフセットとメタデータの厳密な検証
Kafka 版 ApsaraMQ の検査機能は、トピックのオフセットやメタデータなどの情報を検証します。検証メカニズムは、メモリデータの正確性と整合性を確保し、データの不整合によって発生する可能性のある問題を防ぎます。
プロセスステータスのリアルタイムモニタリングのための強力な監視機能
システムの実行中に I/O ハング、スレッドデッドロック、JVM クラッシュ、コネクションフラッディング攻撃、メモリリークなどの問題が発生した場合、検査機能は問題に迅速に対応し、Kafka 版 ApsaraMQ プロセスを自動的に再起動します。これにより、Kafka 版 ApsaraMQ の継続性と可用性が確保され、トラブルシューティングのタイムウィンドウが大幅に短縮されます。
使用上の注意
検査に使用される内部トピックは、
__alikafka_housekeeping_local_topic
と__alikafka_housekeeping_cloud_topic
です。重要Kafka 版 ApsaraMQ インスタンスをデプロイした後、システムは検査用の内部トピックを自動的に作成します。
検査用の内部トピックは、対応するインスタンスを削除した後にのみ削除できます。
検査機能はリソースを消費します。たとえば、最小仕様のクラスターで検査機能を使用する場合、各トピックでメッセージの生成と消費に約 100 ビット/秒のトラフィックと 10 MB のストレージ容量が消費されます。消費される帯域幅の量は、クラスターの仕様と正の相関があります。