HoloWeb は、ビジュアルインターフェイスを介した公開データセットのワンクリックインポートをサポートしています。この機能を使用すると、公開データを迅速にインポートしてクエリを実行できます。このトピックでは、HoloWeb でワンクリックインポートタスクを作成し、そのステータス情報を表示する方法について説明します。
背景情報
HoloWeb は、tpch_10g、tpch_100g、tpch_1t、github_event の 4 つの公開データセットのワンクリックインポートをサポートしています。
-
tpch_10g、tpch_100g、tpch_1tの公開データセットは、小売シナリオをシミュレートしたものです。データ量はそれぞれ 10 GB、100 GB、1 TB です。詳細については、「テスト計画の概要」をご参照ください。 -
github_event公開データセットは、GitHub の公式公開イベントデータセットです。詳細については、「ビジネスとデータの概要」をご参照ください。
前提条件
-
ご利用の Hologres インスタンスは、V1.3.13 以降である必要があります。
-
HoloWeb でインスタンスにログイン済みであること。詳細については、「インスタンスへのログイン」をご参照ください。
注意事項
-
公開データセットのワンクリックインポートをサポートしているのは、中国 (北京)、中国 (上海)、中国 (杭州)、中国 (深セン)、および中国 (張家口) リージョンの Hologres インスタンスのみです。
-
ワンクリックインポートを実行するユーザーは、スキーマの作成、テーブルの作成、およびデータの書き込み権限を持っている必要があります。権限の付与方法については、「Hologres 権限モデル」をご参照ください。
-
公開データセットのインポートタスクが完了するまでには、約 3 分から 20 分かかります。実際の時間はインスタンスタイプなどの要因によって異なります。オンラインビジネスに影響を与えないように、事前に計算リソースを計画してください。
-
インポートタスクは、2 つのスキーマと複数の外部テーブルおよび内部テーブルを自動的に作成します。名前の競合や偶発的なデータ削除を防ぐために、データベース内の既存のスキーマ、外部テーブル、および内部テーブルを確認してください。
公開データセットのインポートタスクの作成
-
HoloWeb 開発者ページに移動します。詳細については、「HoloWeb への接続」をご参照ください。
-
HoloWeb 開発者ページの上部のメニューバーで、Data Solutions をクリックします。
-
Data Solutions ページで、左側のナビゲーションウィンドウにある Import Public Dataset をクリックします。
-
Import Public Dataset ページで、Create Task for Importing Public Dataset をクリックします。
-
Create Task for Importing Public Dataset ページで、Instance Name、データベース、Public Dataset Name を選択します。次に、[Serverless コンピューティングリソースを使用してデータインポートを実行] するかどうかを選択し、Submit をクリックします。

公開データセットのインポートタスク情報の表示
-
Import Public Dataset ページで、Instance Name と データベース を選択し、Search をクリックして公開データセットタスクのリストを表示します。

タスクリストには、次の情報と操作が含まれます:
-
情報: No.、Instance Name、データベース、Public Dataset Name、Status、Progress (完了した SQL 文/合計 SQL 文)、Created At、および End Time。
-
操作: 詳細、停止、Rerun、Delete、Execution History、および Query。
-
-
タスクの Status が Successful に変わると、インポートは完了です。その後、タスクの Actions 列にある Query をクリックしてデータ分析を実行できます。
公開データセットの削除
次の SQL 文を実行して、公開データセットのスキーマとそのすべての依存関係を削除します。例として tpch_100g データセットを使用します。偶発的なデータ削除を防ぐため、この文は注意して使用してください。
DROP SCHEMA hologres_dataset_tpch_100g, hologres_foreign_dataset_tpch_100g CASCADE;