Hiveクラスターから ApsaraDB for SelectDB インスタンスに、カタログ、X2Doris、DataWorks、またはオブジェクトストレージサービス(OSS)を使用してデータを移行できます。 移行するデータ量とビジネスシナリオに基づいて、適切なソリューションを選択できます。このトピックでは、Hiveクラスターから 。ApsaraDB for SelectDB インスタンスにオフラインデータを移行する方法と、移行ソリューションを選択する方法について説明します。
ソリューション
ビジネスシナリオに基づいて、適切な移行ソリューションを選択できます。次の表は、移行ソリューションについて説明しています。
ソリューション | シナリオ | メリット | 参照 |
カタログ | 移行するデータはAlibaba Cloudプラットフォームに保存されています。 説明 このソリューションは、Alibaba Cloud E-MapReduce(EMR)クラスターにデータが保存されているシナリオにも適用できます。 |
| |
OSS | 移行するデータはAlibaba Cloudプラットフォームに保存されていません。 | データ転送料金を発生させることなくデータを移行できます。 説明 OSSバケットから SelectDB インスタンスにデータを移行する場合、データは内部ネットワーク経由で移行され、データ転送料金は発生しません。 | |
DataWorks | 移行するデータはDataWorksによってホストされているか、DataWorksをデータ開発プラットフォームとして使用しています。 | 視覚化プラットフォームを使用してデータを移行できるため、操作が簡素化されます。 |
増分データの移行
本番環境では、Hiveデータは通常、オフラインデータと増分データで構成されます。 Hiveデータの SelectDB への移行には、通常、クエリパフォーマンスを向上させるためにデータをデータウェアハウスに複製することが含まれるため、次のいずれかの方法を使用して増分データを移行できます。
Hiveデータが生成されたときに、Hiveデータを SelectDB に複製します。
スケジュールされたジョブを使用してHiveパーティションからデータを読み取り、データを SelectDB に書き込みます。
参照
Hiveの詳細については、「Hiveデータソース」をご参照ください。