このドキュメントでは、オンラインサービスの可用性を高めるためのベストプラクティスについて説明します。これらのプラクティスは、サービスの中断を最小限に抑え、システムの安定性と信頼性を向上させるのに役立ちます。
クイックスタートガイド
高可用性のベストプラクティスについて学ぶ前に、次のドキュメントを読んで ApsaraDB for SelectDB の使用を開始し、その特徴を理解してください。
(必須) クイックスタート
このドキュメントでは、ApsaraDB for SelectDB の基本的な概念、インスタンスの購入と使用のプロセスについて説明し、データベーステーブル設計の重要な考慮事項をハイライトします。この情報は、ApsaraDB for SelectDB をすぐに使い始めるのに役立ちます。
(オプション) データ移行
MySQL、PostgreSQL、Doris などのさまざまなデータソースから ApsaraDB for SelectDB にデータを移行します。
(任意) Performance Testing
Star Schema Benchmark、TPC-H Benchmark、TPC-DS Benchmark を使用してパフォーマンステストを実行します。
(オプション) ソリューション
リリースと変更の仕様
(必須) 事前テスト
新しい機能をリリースする前に、テストインスタンスで徹底的にテストしてください。高負荷サービスを開始する前に、追加のパフォーマンスストレステストを実行して、本番環境でのパフォーマンスを評価してください。
(必須) グレースケールリリース
オフピーク時に変更をリリースします。10%→50%→100% のような段階的なグレースケールリリースメソッドを使用します。各フェーズの間で 10〜30 分間サービスを観察します。また、オフピーク時では潜在的な問題が明らかにならない可能性があるため、最初のビジネスピーク時にサービスを注意深く監視します。
O&M の推奨事項
(必須) ビジネスモニタリング
ApsaraDB for SelectDB は、広範なモニタリングおよびアラート機能を提供します。ビジネスの観点からサービスを監視するには、複数の主要なメトリックを組み合わせます。平均クエリ応答時間、99 パーセンタイルのクエリ応答時間、クエリ成功率、データインポート速度、CPU 使用率、メモリ使用量に特に注意してください。詳細については、「アラートルールを設定する」をご参照ください。
キャパシティ管理
高負荷サービスの場合は、事前に最適化とストレステストを実行します。これにより、リソースがサポートできる最大クエリ/秒 (QPS) を評価できます。ビジネスの成長に基づいて、またはプロモーションイベントの前に、リソースを評価してスケールアウトします。
バージョンアップデート
ApsaraDB for SelectDB は、マイナーバージョンのアップデートを通じて継続的にバグを修正します。これらのバージョン番号は 3 つまたは 4 つの部分で構成されます。現在のマイナーバージョンの最新のパッチバージョンに速やかにアップグレードすることをお勧めします。アップグレードする前に、テスト環境で新しいバージョンをテストしてください。緊急時には、テクニカルサポートに連絡してロールバックを依頼してください。たとえば、バージョン 4.0.4.2 は 2025 年 2 月 6 日にリリースされました。その後 6 か月間で 12 回更新され、バージョン 4.0.6.1 になりました。迅速にアップグレードすることで、既知の問題を回避できます。
サービス隔離
完全に独立したビジネスシナリオでは、別々のインスタンスを使用します。異なるサービスが同じデータを使用するシナリオでは、マルチ計算グループアーキテクチャを使用します。このアーキテクチャは、単一のインスタンス内に複数の物理的な計算キューを提供し、これらのキューは読み取り/書き込みインスタンスからデータを共有します。
運用訓練
インスタンスの変更
一般的な O&M 操作には、アップグレードとスケールアウトが含まれます。これらの操作を事前にリハーサルして、インスタンスの変更がサービスに与える影響を確認します。ApsaraDB for SelectDB インスタンスの変更中に、一時的な接続の中断が発生する可能性があります。アプリケーションは、失敗した接続を処理してリトライできる必要があります。
障害回復
ApsaraDB for SelectDB は、いくつかの障害回復ソリューションを提供します。たとえば、1 つの計算グループが失敗した場合に新しい計算グループにすばやく切り替えたり、失敗したインスタンスを再起動したり、停止した計算グループを再起動したりできます。これらのソリューションを事前にリハーサルして、プロシージャに慣れておくことをお勧めします。
高可用性アーキテクチャの推奨事項
(オプション) サービススロットリング
ApsaraDB for SelectDB は、論理的なタスクキューであるワークロードグループをサポートしています。ワークロードグループを使用して、さまざまな種類のリクエストやサービスが使用するリソースを制御し、その最大リソース使用量を制限できます。これにより、トラフィックのバースト時にサービススロットリング機能が提供されます。
(オプション) マルチゾーンディザスタリカバリ
ApsaraDB for SelectDB は、マルチゾーンディザスタリカバリのデプロイメントをサポートしています。ゾーンが失敗した場合、システムは自動的にスイッチオーバーを実行します。スイッチオーバーの目標復旧時間 (RTO) は約 10 秒です。
(オプション) データのバックアップと回復
機密性の高いオンラインサービスでは、定期的な毎日のバックアップを有効にすることをお勧めします。重要な変更を行う前に、手動でバックアップを実行することもできます。重大な障害が発生した場合、バックアップデータを使用してサービスを迅速に回復できます。