Alibaba Cloud ディスクは、三副本ストレージ技術を使用して、分散ファイルシステムに基づいて Elastic Compute Service (ECS) インスタンスのデータへの安定した効率的かつ信頼性の高いアクセスを提供し、99.9999999% のデータ信頼性を実現しています。このトピックでは、三副本ストレージに関連する概念と、三副本ストレージの仕組みについて説明します。
概要
Alibaba Cloud は、線形アドレス空間がチャンクに分割されるフラット設計を使用しています。各チャンクは、ストレージクラスターの異なるデータノードに格納された 3 つの複製にレプリケートされ、データの信頼性が確保されます。ディスクに対して読み取りおよび書き込み操作を実行すると、操作は Alibaba Cloud データストレージシステムに格納されているファイルの対応するプロセスに変換されます。
ディスクデータに対するすべてのユーザーレベルの操作は、基盤となるレイヤーの 3 つのチャンク複製間で同期されます。このメカニズムにより、データの信頼性と整合性が確保されます。
三副本ストレージの仕組み
三副本ストレージには、マスター、チャンクサーバー、クライアントという 3 つの主要コンポーネントが関係します。チャンクサーバーは、チャンク複製が格納されるデータノードです。各書き込み操作は、クライアントによって次の方法で実行されます。
クライアントは書き込みリクエストを受信し、書き込み操作に対応するチャンクを決定します。
クライアントはマスターにクエリを実行して、チャンクの 3 つの複製が格納されているチャンクサーバーを見つけます。
クライアントは、マスターから返されたチャンクサーバーに書き込みリクエストを送信します。
3 つのチャンク複製すべてで書き込み操作が成功した場合、クライアントは成功を返します。そうでない場合、クライアントは失敗を返します。
マスターは、各チャンクの複製が異なるラックをまたがる異なるチャンクサーバーに分散されるようにします。これにより、単一のチャンクサーバーまたはラックの障害によってデータが使用できなくなるのを防ぎます。マスターの分散戦略は、チャンクサーバーのディスク使用率、ラック全体へのチャンクサーバーの分散、電力供給状態、ノードのワークロードなど、ストレージシステムの多くの要素を考慮に入れています。
データ保護
データノードが破損した場合、またはデータノードでディスク障害が発生した場合、クラスター内の一部のチャンクの有効な複製数が 3 つ未満になる可能性があります。このような場合、マスターは同期タスクを開始し、チャンクサーバー間でデータをレプリケートして、クラスター内の各チャンクに 3 つの有効な複製があることを確認します。
ウイルス、誤削除、攻撃によるデータ損失を防ぐために、三副本ストレージに加えて、データバックアップや定期的なスナップショットなどの他の保護方法を使用することをお勧めします。データのセキュリティと可用性を確保するために、適切なすべての対策を講じてください。スナップショットの詳細については、「スナップショットの概要」をご参照ください。