三副本ストレージの概念とメカニズム - ECS

ESSD クラウドディスクは、3 レプリカストレージとエンドツーエンドのデータ検証を使用して、データの耐久性と整合性を保証します。ローカル冗長を使用する ESSD クラウドディスクは 99.9999999% (9 つの 9) のデータ信頼性を、ゾーン冗長を使用する ESSD クラウドディスクは 99.9999999999% (12 の 9) のデータ信頼性を提供します。

技術的な利点

データの耐久性：システムは、各データを 3 つのレプリカとして自動的に保存し、異なる物理ノードやラックに分散させます。1 つまたは 2 つのレプリカが利用できなくなった場合でも、残りのレプリカからデータの読み書きが可能です。
データ整合性：データ書き込みおよびストレージプロセスの各段階で、システムは検証アルゴリズムを使用して、データの指紋に似たチェックサムを生成し、後続の各ステップでそれを検証します。データとそのチェックサムの間に不一致が検出された場合、エラー訂正が即座にトリガーされ、転送中およびストレージ中のデータ破損を防止します。この検証はハードウェアアクセラレーションによって高速化されており、読み書き性能への影響はごくわずかです。
自動障害復旧：システムがストレージノードの障害やレプリカ数の不足を検出すると、正常なレプリカからデータを自動的に復元し、完全な 3 レプリカの状態を再構築します。この復旧プロセス全体は、ご利用のアプリケーションに対して透過的に行われます。

保護シナリオ

ハードウェア障害によるデータの非可用性
- 課題：ディスク破損、サーバーのダウンタイム、ラックの電源障害などの予測不可能な障害により、影響を受けた物理デバイス上のデータにアクセスできなくなる可能性があります。
- 技術的保護：3 レプリカストレージの仕組みは、データを異なる物理ノードに分散させます。障害発生時には、システムは自動的に正常なレプリカにフェイルオーバーしてサービス継続性を維持し、バックグラウンドで新しいレプリカを再構築します。これにより、お客様のビジネスへの影響はありません。
サイレントデータ破損
- 課題：メモリのビット反転、ネットワーク転送エラー、ディスクファームウェアやメディアの劣化などの要因により、データ転送中やストレージ中に気づかれないエラーが発生することがあります。これらのエラーは従来の方法では検出しにくいため、データ不整合を引き起こし、データ整合性に対する深刻な脅威となります。
- 技術的保護：エンドツーエンドのデータ検証は、データ書き込みプロセスの各ステップでチェックサムを生成します。データを読み取る際、システムは各段階でこれらのチェックサムを検証します。不一致が検出された場合、システムは即座にエラー訂正をトリガーし、読み取ったデータが書き込まれたデータと同一であることを保証します。

重要

これらの信頼性技術は、インフラストラクチャ層でのハードウェア障害やデータ破損から保護します。誤削除やウイルス攻撃などのアプリケーションレベルのリスクに対しては、スナップショットによる保護が必要です。

3 レプリカストレージの仕組み

3 レプリカストレージの仕組みは、ハードウェア障害によるデータの可用性の問題に対処するために設計されています。システムは、クラウドディスクに書き込まれた各データを基盤層で自動的に 3 つのコピーに複製し、それらを異なる物理ノードに保存します。

データ書き込みプロセス

三副本技术

システムは、複数レプリカへの同期書き込みメカニズムを使用します。書き込み操作は、データがすべてのレプリカに書き込まれた場合にのみ成功し、それ以外の場合は失敗します。このメカニズムは強力な整合性を保証し、後続の読み取りリクエストが常に最新の書き込みデータにアクセスできることを意味します。

レプリカ配置戦略

ラックの電源障害などにより複数のレプリカが利用できなくなる相関障害を防ぐため、3 レプリカストレージの仕組みは、自動的に以下の配置戦略に従います：

ラック隔離：システムは 3 つのレプリカを異なるラック上のストレージノードに分散させます。単一のマシンまたは単一のラックの障害が、データの可用性に影響を与えることはありません。
障害ドメインの隔離：ローカル冗長を使用する ESSD クラウドディスクの場合、システムは 3 つのレプリカを同一アベイラビリティゾーン内の異なるラックに分散させます。ゾーン冗長を使用する ESSD クラウドディスクの場合、システムはレプリカを異なるアベイラビリティゾーンに分散させます。これにより、ディザスタリカバリ機能がラックレベルからアベイラビリティゾーンレベルに向上します。
負荷分散：隔離要件を満たしつつ、システムはストレージ容量、I/O 負荷、ネットワークトポロジーも考慮し、リソース使用率の均等化と最適なパフォーマンスを実現します。

障害復旧プロセス

数据保护机制

システムは、自動化されたデータの自己修復機能を備えています。システムがレプリカ数の不足を検出すると、自動的に復旧プロセスをトリガーします。システムは、隔離ポリシーを満たす新しい正常なストレージノードを選択し、既存のレプリカからデータをコピーして、迅速に完全な 3 レプリカの状態を復元します。このプロセス全体は、ご利用のアプリケーションに対して透過的に行われ、手動介入は不要です。

エンドツーエンドのデータ検証

エンドツーエンドのデータ検証は、データ転送およびストレージ中のサイレントデータ破損の問題を解決するために設計されています。

検証プロセス

エンドツーエンドとは、書き込みおよびストレージプロセスの各段階で、システムが巡回冗長検査 (CRC) コードを使用してデータ整合性を検証することを意味します。

I/O リクエストの開始後：データがブロックストレージパスに入ると、初期チェックサムが生成されます。
メモリコピー後：データがコンピュートノードのメモリにコピーされた後、システムはチェックサムを比較してデータエラーを検出します。
ネットワーク転送後：データがストレージノードのネットワーク層に到達すると、システムはチェックサムを比較して転送中のビットエラーを検出します。
ストレージノードでの受信時：データがストレージノードのメモリに書き込まれた後、システムはチェックサムを比較します。
ディスクへの永続化時：データがディスクに書き込まれた後、システムはチェックサムを比較します。

いずれかの段階でチェックサムの不一致が検出された場合、システムは即座にエラー処理をトリガーします。この検証はハードウェアアクセラレーションによって高速化されており、読み書き性能への影響はごくわずかです。

エラー処理

システムは、エラーが発生した場所に応じて、異なる方法でエラーを処理します：

ネットワークトランスポート層：システムは、検証が成功するまでデータを自動的に再送します。
ストレージメディア：システムは不良ブロックをマークし、他のレプリカから正しいデータを読み取って回復します。
メモリ：エラー訂正符号 (ECC) メカニズムが自動的にエラーを訂正し、システムは I/O 操作を再試行します。

よくある質問

3 レプリカストレージの仕組みでは、3 倍のストレージ容量に対して料金を支払う必要がありますか？
いいえ。3 レプリカストレージは、Alibaba Cloud が提供する組み込みのデータ信頼性機能です。基盤となる 3 倍のストレージの冗長性にかかるコストは Alibaba Cloud が負担します。お客様は、購入したクラウドディスクの容量に対してのみ料金をお支払いいただきます。たとえば、40 GiB のクラウドディスクを購入した場合、使用可能領域と課金対象容量はどちらも 40 GiB です。
データをさらに保護するにはどうすればよいですか？
- 自動スナップショットポリシーを作成して、定期的なバックアップを実行します。問題が発生した場合、スナップショットを使用してクラウドディスクをロールバックできます。
- リージョン間でスナップショットをコピーします。障害が発生した場合、スナップショットを使用してデータディスクを作成し、スタンバイインスタンスにアタッチできます。
3 レプリカストレージの仕組みは、あらゆる種類のデータ損失を防ぐことができますか？
3 レプリカストレージの仕組みは、インフラストラクチャ層でのハードウェア障害から保護します。誤削除やウイルス攻撃などのアプリケーションレベルのリスクに対しては、スナップショットによる保護が必要です。
3 レプリカストレージの仕組みは、どのようにデータ整合性を保証しますか？
システムは、複数レプリカへの同期書き込みメカニズムを使用します。書き込み操作は、データがすべてのレプリカに書き込まれた場合にのみ成功し、それ以外の場合は失敗します。このメカニズムは強力な整合性を保証し、後続の読み取りリクエストが常に最新の書き込みデータにアクセスできることを意味します。