Cloud Backup は、非構造化ファイルシステムのデータ同期機能を提供します。ソース側にあるデータソース(File Storage NAS (NAS) ファイルシステム、Hadoop 分散ファイルシステム (HDFS)、S3 互換ストレージバケット、Object Storage Service (OSS) バケット、Cloud Parallel File Storage (CPFS) ファイルシステム、OSS 互換ストレージバケットなど)を、宛先側(Alibaba Cloud を含む)のデータソースに同期できます。このトピックでは、Cloud Backup のデータ同期機能の概要(概要、動作メカニズム、手順、費用を含む)について説明します。
概要
データ同期機能は、Cloud Backup が提供するオンライン サービスであり、ソース側にあるデータソース(NAS ファイルシステム、HDFS、S3 互換ストレージバケット、OSS バケット、CPFS ファイルシステム、OSS 互換ストレージバケットなど)を、宛先側(Alibaba Cloud を含む)のデータソースに同期するために使用されます。
Windows 版 Cloud Backup クライアントは、ネットワーク ファイル システム (NFS) のマウントをサポートしていません。ソースまたは宛先に NFS ファイルシステムが存在する場合は、同期プランの作成時に Linux 版 Cloud Backup クライアントを選択してください。
OSS と S3 互換ストレージはどちらもアーカイブ オブジェクトの同期をサポートしていません。オブジェクトのデータ(シンボリックリンクが指すオブジェクトを含む)のみが複製されます。オブジェクトに対する読み取り/書き込み権限などのメタデータ情報はサポートされていません。
メリット
増分データ同期
増分同期がサポートされています。同期ジョブはスケジュールに従って自動的に実行できます。増分同期中は、変更されたファイルのみが同期されるため、同期効率が大幅に向上します。
使いやすさ
クラウド データソースはネイティブでサポートされており、簡単に構成できます。
超高性能
従来のコピー ツールと比較して、最適化されたデータ伝送チャネルにより、データ同期のパフォーマンスが大幅に向上します。
データ同期の仕組み
1 つ以上のオンプレミス サーバーに Cloud Backup クライアントをインストールしてアクティブ化します。次に、Cloud Backup コンソールにログインして、ソースと宛先のデータソースを追加します。
同期プランを作成します。同期ジョブを実行すると、Cloud Backup クライアント グループが指定されたフォルダをスキャンして同期するファイルを特定し、増分データをクラウドにアップロードします。
Cloud Backup を使用すると、インターネット、仮想プライベートネットワーク (VPN)、または Express Connect 回線を介して Alibaba Cloud にデータを同期できます。インターネット経由でデータを同期する場合は、Cloud Backup クライアントがインストールされているサーバーがインターネットにアクセスできることを確認してください。サーバーの IP アドレスをインターネットに公開する必要はありません。
手順
Cloud Backup コンソールでデータを同期するには、次の手順を実行します。
HDFS、オンプレミス NAS ファイルシステム、S3 互換ストレージバケット、CPFS ファイルシステム、OSS バケット、OSS 互換ストレージバケットからデータを同期する前に、データソースが配置されているサーバーに Cloud Backup クライアントをインストールする必要があります。クライアントは、Cloud Backup とのデータ接続を確立し、サービスを管理するために使用されます。
Cloud Backup のアクティブ化は無料です。Cloud Backup のデータ同期機能の使用は無料です。インターネット経由でファイルを読み取り、ファイルを保存するために NAS を使用した場合は課金されます。OSS を使用してファイルを保存した場合は課金されます。詳細については、「NAS の課金概要」および「OSS の課金概要」をご参照ください。
HDFS、オンプレミス NAS ファイルシステム、S3 互換ストレージバケット、CPFS ファイルシステム、OSS バケット、OSS 互換ストレージバケットからデータを同期する前に、データ同期ジョブが実行されるサーバーに Cloud Backup クライアントをインストールする必要があります。サーバーは、データソースが存在するネットワークに接続されている必要があります。クライアントは、Cloud Backup とのデータ接続を確立し、サービスを管理するために使用されます。
Cloud Backup コンソールで、HDFS、オンプレミス NAS ファイルシステム、S3 互換ストレージバケット、CPFS ファイルシステム、OSS バケット、OSS 互換ストレージバケットなどのデータソースを追加します。
データ同期プランを作成します。Cloud Backup はプランを実行し、プランに基づいて継続的にデータを同期します。データ同期機能はデータ同期のみを担い、データの整合性や完全性は保証しません。同期ジョブの完了後、同期されたデータの完全な検証を実行し、ソースと宛先の間のデータ整合性を自分で確認する必要があります。
データ同期ジョブの完了後、宛先で転送されたデータを確認して、正確性を確保してください。ソース データを削除する前に宛先でデータを確認しなかったためにデータが失われた場合の損失や結果は、お客様の責任となります。
制限事項
Windows 版 Cloud Backup クライアントは、ネットワーク ファイル システム (NFS) のマウントをサポートしていません。ソースまたは宛先に NFS ファイルシステムが存在する場合は、同期プランの作成時に Linux 版 Cloud Backup クライアントを選択してください。
OSS と S3 互換ストレージはどちらもアーカイブ オブジェクトの同期をサポートしていません。オブジェクトのデータ(シンボリックリンクが指すオブジェクトを含む)のみが複製されます。オブジェクトに対する読み取り/書き込み権限などのメタデータ情報はサポートされていません。
増分ファイル リスト (ChangeList)
Cloud Backup は、増分ファイル リストに基づいてデータを同期します。フル スキャンを実行する必要はありません。これにより、ファイル スキャンのコストが削減され、同期効率が向上します。同期プランを作成するときに、選択したデータソースが OSS バケットまたは S3 互換ストレージバケットである場合は、カスタム増分ファイル リストを使用して同期できます。
増分ファイル リストは、データソース上で同期されるファイルに関する情報を含む CSV テーブルです。テーブルの各行は 1 つのファイルを表します。「Name」フィールドは、データソースの同期パスに対する相対パスを示します。次の図は、
changeList1.csvテーブルを示しています。「Name」フィールドは必須の列であり、同期されるファイルが記録されます。他の列はサポートされていません。
説明「Name」列の値は一意である必要があります。同じファイル名が使用されている場合、データ同期中に同じ名前のファイルが互いに上書きされます。
「Name」フィールドの値はディレクトリではなく、ファイルである必要があります。
同期プランを作成するときに、増分ファイル リストが配置されているパスを入力します。データ同期ジョブが開始されると、Cloud Backup はソースのパスにあるすべての CSV ファイルを読み取り、ファイルを解析し、同期されるファイルを宛先に転送します。
説明たとえば、OSS から NAS への同期のプランを作成する場合、増分ファイル リストを使用して同期するファイルを指定できます。増分ファイル リスト
changeList1.csvとchangeList2.csvがソースのパス/changelistに保存されている場合、増分ファイル リストのパスの値は/changelistです。各 CSV テーブル内のファイルが処理されると、CSV テーブルはディレクトリの
/Completedレベルに移動されます。処理前の CSV テーブルのディレクトリ
処理後の CSV テーブルのディレクトリ
/changelist/changeList1.csv /changelist/changeList2.csv/changelist/Completed/changeList1.csv /changelist/Completed/changeList2.csv
課金
Cloud Backup のデータ同期機能の使用は無料です。
NAS を使用してファイルを保存した場合は課金されます。詳細については、「NAS の課金概要」をご参照ください。
OSS を使用してファイルを保存した場合は課金されます。詳細については、「OSS の課金概要」をご参照ください。