すべてのプロダクト
Search
ドキュメントセンター

ApsaraDB for SelectDB:Hiveクラスターからのデータ移行

最終更新日:Jan 16, 2025

Hiveクラスターから ApsaraDB for SelectDB インスタンスに、カタログ、X2Doris、DataWorks、またはオブジェクトストレージサービス(OSS)を使用してデータを移行できます。 移行するデータ量とビジネスシナリオに基づいて、適切なソリューションを選択できます。このトピックでは、Hiveクラスターから ApsaraDB for SelectDB インスタンスにオフラインデータを移行する方法と、移行ソリューションを選択する方法について説明します。

ソリューション

ビジネスシナリオに基づいて、適切な移行ソリューションを選択できます。次の表は、移行ソリューションについて説明しています。

ソリューション

シナリオ

メリット

参照

カタログ

移行するデータはAlibaba Cloudプラットフォームに保存されています。

説明

このソリューションは、Alibaba Cloud E-MapReduce(EMR)クラスターにデータが保存されているシナリオにも適用できます。

  • データ転送料金を発生させることなくデータを移行できます。

    説明

    Hiveクラスターと SelectDB インスタンスは同じ仮想プライベートクラウド(VPC)内にあります。データは内部ネットワーク経由で移行されます。

  • 外部コンポーネントを使用せずにデータを移行できます。

Hiveデータソース

OSS

移行するデータはAlibaba Cloudプラットフォームに保存されていません。

データ転送料金を発生させることなくデータを移行できます。

説明

OSSバケットから SelectDB インスタンスにデータを移行する場合、データは内部ネットワーク経由で移行され、データ転送料金は発生しません。

OSSを使用したデータのインポート

DataWorks

移行するデータはDataWorksによってホストされているか、DataWorksをデータ開発プラットフォームとして使用しています。

視覚化プラットフォームを使用してデータを移行できるため、操作が簡素化されます。

DataWorks を使用したデータのインポート

増分データの移行

本番環境では、Hiveデータは通常、オフラインデータと増分データで構成されます。 Hiveデータの SelectDB への移行には、通常、クエリパフォーマンスを向上させるためにデータをデータウェアハウスに複製することが含まれるため、次のいずれかの方法を使用して増分データを移行できます。

  • Hiveデータが生成されたときに、Hiveデータを SelectDB に複製します。

  • スケジュールされたジョブを使用してHiveパーティションからデータを読み取り、データを SelectDB に書き込みます。

参照

Hiveの詳細については、「Hiveデータソース」をご参照ください。