このトピックでは、ファイルゲートウェイのキャッシュディスクの仕組みについて説明します。
キャッシュディスクの仕組み
ファイルゲートウェイのキャッシュディスクは、Cloud Storage Gateway で設定されるクラウドディスクです。ユーザーデータとメタデータを集約してキャッシュします。主な特徴は次のとおりです。
マウントポイントを介して書き込まれたデータをキャッシュします。ファイルが閉じられると、ゲートウェイはデータを 1 回の操作で Object Storage Service (OSS) にアップロードします。これにより、ゲートウェイはシーケンシャル書き込みとランダム書き込みの両方の操作をサポートできます。データがアップロードされると、対応するキャッシュ領域はポリシーに基づいて自動的に取り消されます。
読み取りデータをキャッシュして、繰り返しファイルにアクセスする際のレイテンシを削減します。大きなファイルの場合、事前読み取りメカニズムによってデータがキャッシュディスクに読み込まれます。これにより、ファイルの読み取り帯域幅が向上します。
ディレクトリ構造などのメタデータをキャッシュして、
lsやstatなどのファイルシステムのメタデータ操作を高速化します。ゲートウェイは、柔軟なメタデータ同期メカニズムも提供します。これらには、高速同期、定期的なリモート同期、および 1 回限りのリモート同期が含まれ、さまざまなシナリオでのデータ整合性の要件を満たします。ゲートウェイは、キャッシュディスクの使用状況に基づいて、長期間アクセスされていないファイルデータを自動的に削除します。データのみが削除されます。ファイル名、ディレクトリ構造、権限などのメタデータは保持されます。これにより、キャッシュディスクの使用率が健全なレベル (通常は約 60%) に維持されます。
キャッシュディスクには、データとメタデータの両方が保存されます。領域は比例的に割り当てられます。80% がデータキャッシュに使用され、20% がメタデータキャッシュに使用されます。
重要な注意点
適切なキャッシュディスクタイプを選択してください。
キャッシュディスクタイプを選択する際は、帯域幅と IOPS (input/output operations per second) のビジネス要件に合わせてください。また、最適な効率を達成するために、キャッシュディスクのパフォーマンスがゲートウェイの仕様と一致していることを確認してください。たとえば、Basic および Medium ゲートウェイには ESSD PL1 キャッシュディスクを使用し、Enhanced および Compute-optimized ゲートウェイには ESSD PL2 キャッシュディスクを使用します。
適切なキャッシュディスク容量を選択してください。
キャッシュディスク容量を選択する際は、データキャッシュとメタデータキャッシュの両方の要件を考慮してください。
データキャッシュ容量は、同時実行数と最大ファイルサイズに依存します。書き込みの失敗やパフォーマンスの低下を防ぐために、データ用のキャッシュディスクの空き領域は、同時実行数 × 最大ファイルサイズの積よりも大きくする必要があります。パフォーマンスを向上させるために、空き領域の約 30% を予約してください。
メタデータキャッシュには、次のようなファイルシステムの構造情報が保存されます。
ディレクトリ構造
サイズや作成/変更時間などのファイルプロパティ
スタブファイル: ファイルデータが削除されても、ファイルレコードはメタデータに保持されます。これにより、ユーザーがフォルダを閲覧する際に一貫したビューが保証されます。ユーザーが削除されたファイルに再度アクセスすると、ゲートウェイは自動的に OSS からキャッシュにデータを再読み込みします。
メタデータキャッシュの容量は、ファイルの総数と密接に関連しています。通常、100 GB のキャッシュディスクで約 1,000 万個のファイルのメタデータを管理できます。
データキャッシュまたはメタデータキャッシュの領域が不足すると、システムはスロットリングおよびメタデータ領域不足のアラートをトリガーします。ビジネスの中断を避けるために、アラートを受信したら速やかにキャッシュディスクをスケールアウトしてください。これにより、ゲートウェイが安定的かつ効率的に実行されることが保証されます。