全部产品
Search
文档中心

E-MapReduce:Katalog

更新时间:Jun 24, 2025

StarRocks 2.3 dan versi lebih baru mendukung fitur katalog yang memungkinkan pengelolaan data internal dan eksternal dalam satu sistem. Dengan fitur ini, Anda dapat mengakses dan menanyai data dari berbagai sumber data eksternal dengan mudah. Topik ini menjelaskan konsep katalog serta cara menggunakannya untuk mengelola dan menanyai data internal dan eksternal.

Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia.Istilah

  • Data internal: Data yang disimpan di StarRocks.

  • Data eksternal: Data yang disimpan di sumber data eksternal seperti Apache Hive, Apache Iceberg, Apache Hudi, Delta Lake, dan Java Database Connectivity (JDBC).

Ikhtisar Katalog

StarRocks mendukung dua jenis katalog: katalog internal dan katalog eksternal.

  • Katalog internal digunakan untuk mengelola semua data internal dalam kluster StarRocks. Contohnya, basis data dan tabel yang dibuat menggunakan pernyataan CREATE DATABASE dan CREATE TABLE dikelola dalam katalog internal kluster StarRocks. Setiap kluster StarRocks hanya memiliki satu katalog internal bernama default_catalog.

  • Katalog eksternal digunakan untuk terhubung ke Metastore eksternal. Di StarRocks, Anda dapat langsung menanyai data eksternal menggunakan katalog eksternal tanpa perlu mengimpor atau memigrasi data. Berikut adalah jenis-jenis katalog eksternal yang didukung:

    Saat menggunakan katalog eksternal untuk menanyai data dari sumber data eksternal, StarRocks memanfaatkan dua komponen utama dari sumber data tersebut:

    • Layanan metadata: Digunakan untuk mengekspos metadata kepada node frontend (FE) kluster StarRocks guna menghasilkan rencana kueri.

    • Sistem penyimpanan: Digunakan untuk menyimpan data. File data disimpan dalam format berbeda di sistem file terdistribusi atau sistem penyimpanan objek. Setelah FE mendistribusikan rencana kueri yang dihasilkan ke setiap node backend (BE) atau node komputasi (CN), BE atau CN memindai data yang diinginkan di sistem penyimpanan secara paralel, melakukan komputasi, lalu mengembalikan hasil kueri.

Menggunakan katalog

  • Metode 1: Jalankan pernyataan SET CATALOG <catalog_name> di SQL Editor.

  • Metode 2: Beralih ke katalog yang berlaku dalam sesi saat ini dari daftar drop-down katalog, lalu gunakan katalog tersebut untuk menanyai data.

    image

Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia.Menanyai data

Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia. Saya akan mengikuti aturan yang telah ditentukan untuk melaksanakan tugas ini.Menanyai data internal

Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia.Menanyai data eksternal

Menanyai data lintas katalog

Untuk menanyai data lintas katalog, Anda dapat mereferensikan data yang diinginkan dengan menentukan tujuan dalam format nama_katalog.nama_db atau nama_katalog.nama_db.nama_tabel.

  • Di katalog default_catalog, jalankan pernyataan berikut untuk menanyai data dari tabel hive_table di katalog hive_catalog:

    SELECT * FROM hive_catalog.hive_db.hive_table;
  • Di katalog hive_catalog, jalankan pernyataan berikut untuk menanyai data dari tabel olap_table di katalog default_catalog:

    SELECT * FROM default_catalog.olap_db.olap_table;
  • Di katalog hive_catalog, jalankan pernyataan berikut untuk melakukan kueri federasi pada tabel hive_table dan tabel olap_table di katalog default_catalog:

    SELECT * FROM hive_table h JOIN default_catalog.olap_db.olap_table o WHERE h.id = o.id;
  • Di katalog lainnya, jalankan pernyataan berikut untuk melakukan kueri federasi pada tabel hive_table di katalog hive_catalog dan tabel olap_table di katalog default_catalog:

    SELECT * FROM hive_catalog.hive_db.hive_table h JOIN default_catalog.olap_db.olap_table o WHERE h.id = o.id;