全部产品
Search
文档中心

Hologres:Impor dataset publik dengan beberapa klik

更新时间:Jul 02, 2025

Gunakan HoloWeb untuk mengimpor dataset publik secara visual hanya dengan beberapa klik. Proses ini mempermudah impor dan kueri data publik. Topik ini menjelaskan cara menggunakan HoloWeb untuk membuat tugas impor dataset publik serta melihat statusnya.

Informasi latar belakang

Di HoloWeb, Anda dapat mengimpor dataset publik tpch_10g, tpch_100g, tpch_1t, dan github_event hanya dengan beberapa klik.

  • Dataset publik tpch_10g, tpch_100g, dan tpch_1t adalah dataset sampel dalam skenario ritel. Dataset publik tpch_10g berisi 10 GB data, dataset publik tpch_100g berisi 100 GB data, dan dataset publik tpch_1t berisi 1 TB data. Untuk informasi lebih lanjut, lihat Rencana Pengujian.

  • Dataset publik github_event tersedia di GitHub. Untuk informasi lebih lanjut, lihat Pengenalan Bisnis dan Data.

Prasyarat

  • Versi instance Hologres Anda adalah V1.3.13 atau yang lebih baru.

  • Instance Hologres terhubung ke HoloWeb. Untuk informasi lebih lanjut, lihat Masuk ke Instance.

Peringatan

  • Fitur impor dataset publik didukung oleh instance Hologres yang diterapkan di wilayah berikut: Tiongkok (Beijing), Tiongkok (Shanghai), Tiongkok (Hangzhou), Tiongkok (Shenzhen), dan Tiongkok (Zhangjiakou).

  • Untuk mengimpor dataset publik dengan beberapa klik, Anda harus memiliki izin untuk membuat skema, tabel, dan menulis data. Untuk informasi lebih lanjut, lihat Model Izin Hologres.

  • Proses impor dataset publik ke instance Hologres dapat memakan waktu antara 3 hingga 20 menit. Durasi bervariasi berdasarkan spesifikasi instance. Kami menyarankan Anda merencanakan sumber daya komputasi sebelumnya untuk mencegah dampak negatif pada bisnis online Anda.

  • Dalam tugas impor dataset publik, dua skema dan beberapa tabel asing serta tabel internal dibuat secara otomatis. Pastikan tidak ada skema dan tabel yang sudah ada di instance Hologres Anda memiliki nama yang sama dengan skema dan tabel yang dibuat secara otomatis untuk mencegah penghapusan data secara tidak sengaja.

Buat tugas impor dataset publik

  1. Buka konsol HoloWeb. Untuk informasi lebih lanjut, lihat Hubungkan ke HoloWeb dan Lakukan Kueri.

  2. Di konsol HoloWeb, klik Data Solutions di bilah navigasi atas.

  3. Di halaman Data Solutions, klik Import Public Dataset di panel navigasi di sebelah kiri.

  4. Di halaman Import Public Dataset, klik Create Task for Importing Public Dataset.

  5. Di halaman Create Task for Importing Public Dataset, konfigurasikan parameter Instance Name, Database, dan Public Dataset Name. Aktifkan atau nonaktifkan saklar Use Serverless Computing Resource to Import Data, lalu klik Submit.

    image

Lihat informasi tentang tugas impor dataset publik

  1. Di halaman Import Public Dataset, konfigurasikan parameter Instance Name dan Database, lalu klik Query.

    image

    Anda dapat melihat informasi yang ditampilkan dalam daftar tugas dan melakukan operasi pada tugas:

    • Informasi yang ditampilkan: No., Instance Name, Database, Public Dataset Name, Status, Progress, Created At, dan Ended At. Progres ditampilkan dalam format berikut: Jumlah pernyataan SQL yang selesai/Total jumlah pernyataan SQL.

    • Operasi yang didukung: Details, Stop, Rerun, Delete, Execution History, dan Query.

  2. Ketika status tugas berubah menjadi Successful, tugas impor dataset publik selesai. Kemudian, Anda dapat mengklik Query di kolom Actions untuk menganalisis data lebih lanjut.

Hapus dataset publik

Eksekusi pernyataan SQL berikut untuk menghapus skema tempat dataset publik yang ingin Anda hapus berada beserta semua dependensinya. Dalam contoh ini, dataset tpch_100g dihapus. Berhati-hatilah saat melakukan operasi ini.

DROP SCHEMA hologres_dataset_tpch_100g, hologres_foreign_dataset_tpch_100g CASCADE;