すべてのプロダクト
Search
ドキュメントセンター

Tablestore:Tablestore から OSS へのデータ同期

最終更新日:Feb 11, 2025

DataWorks Data Integration を使用して、Tablestore 内の完全データと増分データを Object Storage Service に同期できます。 このようにして、Tablestore データがバックアップされ、OSS で Tablestore データを使用できます。

しくみ

DataWorks Data Integration のオフライン同期機能は、異なるデータソースとデスティネーション間の同期を、データソースからデータを読み取るために使用される Reader プラグインと、デスティネーションにデータを書き込むために使用される Writer プラグインに抽象化します。 これにより、データソースとデスティネーションを定義し、それらを DataWorks スケジューリングパラメータと共に使用して、データソースからデスティネーションに完全データまたは増分データを同期できます。

Tablestore データを OSS に同期する場合、オフライン同期タスクのために Tablestore 関連の Reader プラグインと OSS 関連の Writer プラグインを構成する必要があります。 以下の項目では、プラグインの使用上の注意点を説明します。

  • Tablestore 関連の Reader プラグイン

    必要な Tablestore 関連の Reader プラグインは、使用するデータ同期モードによって異なります。 次の表に、データ同期モードと Tablestore 関連の Reader プラグイン間のマッピングを示します。

    同期モード

    Tablestore 関連の Reader プラグイン

    プラグインの説明

    完全エクスポート

    Tablestore Reader

    このプラグインは、Tablestore テーブルからデータを読み取るために使用されます。 抽出するデータの範囲を指定して、増分抽出を実行できます。 詳細については、「Tablestore データソース」をご参照ください。

    増分同期

    OTSStream Reader

    このプラグインは、Tablestore テーブルのデータを増分モードでエクスポートするために使用されます。 詳細については、「Tablestore Stream データソース」をご参照ください。

  • OSS 関連の Writer プラグイン

    DataWorks は、完全エクスポートモードまたは増分同期モードのどちらを使用するかに関係なく、OSS 関連の Writer プラグインを使用して OSS にデータを書き込みます。 詳細については、「OSS データソース」をご参照ください。

同期モード

オフライン同期タスクでデータフィルタを構成し、スケジューリングパラメータを使用して、完全データまたは増分データのどちらを同期するかを決定できます。 次の表に、同期モードを示します。

同期モード

説明

完全エクスポート

このモードでは、Tablestore の完全データが一度に OSS にエクスポートされます。

このモードを使用する場合、オフライン同期タスクを実行する必要があるのは 1 回だけです。 オフライン同期タスクのスケジューリングパラメータを構成する必要はありません。

増分同期

このモードでは、Tablestore の新規データと変更されたデータが定期的に OSS に同期されます。

このモードを使用する場合、オフライン同期タスクのスケジューリングパラメータを構成する必要があります。 このようにして、増分データが定期的に同期されます。

シナリオ

低コストで Tablestore データをバックアップする必要がある場合、または Tablestore データをファイルとしてローカルデバイスにエクスポートする場合。

手順

手順は、使用する同期モードによって異なります。 同期モードに固有の手順を使用してください。 詳細については、「Tablestore から OSS に完全データをエクスポートする」および「増分データを OSS に同期する」をご参照ください。

完全エクスポート手順

次の表に、完全エクスポートモードの主要な手順を示します。

手順

操作

説明

1

データソースを追加する

この手順は、データを同期するテーブルのインスタンス情報を指定するために行います。 データソースは Tablestore です。

2

デスティネーションを追加する

この手順は、データを同期する OSS バケットの情報を指定するために行います。 デスティネーションは OSS です。

3

オフラインタスクノードを作成する

オフライン同期操作には、オフラインタスクノードが必要です。 同期操作ごとにオフラインタスクノードを作成する必要があります。

4

オフライン同期タスクを構成して開始する

DataWorks Data Integration は、オフライン同期タスクを構成するために、ウィザードモードとスクリプトモードを提供します。 ビジネス要件に基づいてモードを選択します。

  • ウィザードモード:グラフィカルユーザーインターフェイスでデータ同期タスクを構成できます。 このモードは使いやすく、限られた機能のみを提供します。

  • スクリプトモード:データ同期の JSON スクリプトを記述して、データ同期開発を完了できます。 このモードは上級ユーザーに適しており、学習コストが高くなります。 このモードは、柔軟で詳細な構成を容易にする高度な機能をサポートしています。

5

移行結果を確認する

データのエクスポート後、[OSS コンソール] でインポートされたデータを表示できます。

増分同期手順

次の表に、増分同期モードの主要な手順を示します。

手順

操作

説明

1

データソースを追加する

この手順は、データを同期するテーブルのインスタンス情報を指定するために行います。 データソースは Tablestore です。

既存の Tablestore データソースがビジネス要件を満たしている場合は、この手順をスキップします。

2

デスティネーションを追加する

この手順は、データを同期する OSS バケットの情報を指定するために行います。 デスティネーションは OSS です。

既存の OSS データソースがビジネス要件を満たしている場合は、この手順をスキップします。

3

オフラインタスクノードを作成する

オフライン同期操作には、オフラインタスクノードが必要です。 同期操作ごとにオフラインタスクノードを作成する必要があります。

4

オフライン同期タスクを構成して開始する

DataWorks Data Integration は、オフライン同期タスクを構成するために、ウィザードモードとスクリプトモードを提供します。 ビジネス要件に基づいてモードを選択します。

  • ウィザードモード:グラフィカルユーザーインターフェイスでデータ同期タスクを構成できます。 このモードは使いやすく、限られた機能のみを提供します。

  • スクリプトモード:データ同期の JSON スクリプトを記述して、データ同期開発を完了できます。 このモードは上級ユーザーに適しており、学習コストが高くなります。 このモードは、柔軟で詳細な構成を容易にする高度な機能をサポートしています。

5

スケジューリングパラメータを構成する

この手順は、同期タスクの実行時間、再実行プロパティ、およびスケジューリングの依存関係を構成して、同期タスクを定期的に実行できるようにするために行います。

6

コードをデバッグしてタスクを送信する

デバッグが成功したら、オフライン同期タスクをサーバーに送信して、スケジューリングプロパティに基づいてタスクを定期的に実行できるようにします。

7

タスク実行結果を表示する

DataWorks コンソールでタスクの実行ステータスを確認し、OSS コンソールでデータ同期の結果を確認できます。

課金ルール

  • Tablestore から OSS にデータを同期すると、消費される容量単位(CU)数に基づいて、Tablestore データの読み取りに対して Tablestore によって課金されます。従量課金制読み取り CU と予約型読み取り CU に対して個別に課金されます。従量課金制読み取り CU または予約型読み取り CU のどちらが消費されるかは、アクセスするインスタンスのタイプによって異なります。詳細については、「課金の概要」をご参照ください。

    説明

    インスタンスタイプと CU の詳細については、「インスタンス」と「読み取り/書き込みスループット」をご参照ください。

  • データが OSS に同期されると、ストレージの使用量と期間に基づいて、データファイルのストレージに対して OSS によって課金されます。 OSS からローカルデバイスにオブジェクトをダウンロードする場合、GET API リクエストの数とインターネット経由のアウトバウンドトラフィック量に対して OSS によって課金されます。詳細については、「OSS 課金概要」をご参照ください。