StarRocks 2.3 dan versi lebih baru mendukung fitur katalog yang memungkinkan pengelolaan data internal dan eksternal dalam satu sistem. Dengan fitur ini, Anda dapat mengakses dan menanyai data dari berbagai sumber data eksternal dengan mudah. Topik ini menjelaskan konsep katalog serta cara menggunakannya untuk mengelola dan menanyai data internal dan eksternal.
Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia.Istilah
Data internal: Data yang disimpan di StarRocks.
Data eksternal: Data yang disimpan di sumber data eksternal seperti Apache Hive, Apache Iceberg, Apache Hudi, Delta Lake, dan Java Database Connectivity (JDBC).
Ikhtisar Katalog
StarRocks mendukung dua jenis katalog: katalog internal dan katalog eksternal.
Katalog internal digunakan untuk mengelola semua data internal dalam kluster StarRocks. Contohnya, basis data dan tabel yang dibuat menggunakan pernyataan CREATE DATABASE dan CREATE TABLE dikelola dalam katalog internal kluster StarRocks. Setiap kluster StarRocks hanya memiliki satu katalog internal bernama default_catalog.
Katalog eksternal digunakan untuk terhubung ke Metastore eksternal. Di StarRocks, Anda dapat langsung menanyai data eksternal menggunakan katalog eksternal tanpa perlu mengimpor atau memigrasi data. Berikut adalah jenis-jenis katalog eksternal yang didukung:
Saat menggunakan katalog eksternal untuk menanyai data dari sumber data eksternal, StarRocks memanfaatkan dua komponen utama dari sumber data tersebut:
Layanan metadata: Digunakan untuk mengekspos metadata kepada node frontend (FE) kluster StarRocks guna menghasilkan rencana kueri.
Sistem penyimpanan: Digunakan untuk menyimpan data. File data disimpan dalam format berbeda di sistem file terdistribusi atau sistem penyimpanan objek. Setelah FE mendistribusikan rencana kueri yang dihasilkan ke setiap node backend (BE) atau node komputasi (CN), BE atau CN memindai data yang diinginkan di sistem penyimpanan secara paralel, melakukan komputasi, lalu mengembalikan hasil kueri.
Menggunakan katalog
Metode 1: Jalankan pernyataan
SET CATALOG <catalog_name>di SQL Editor.Metode 2: Beralih ke katalog yang berlaku dalam sesi saat ini dari daftar drop-down katalog, lalu gunakan katalog tersebut untuk menanyai data.

Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia.Menanyai data
Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia. Saya akan mengikuti aturan yang telah ditentukan untuk melaksanakan tugas ini.Menanyai data internal
Silakan berikan teks bahasa Inggris yang perlu diterjemahkan ke dalam bahasa Indonesia.Menanyai data eksternal
Menanyai data lintas katalog
Untuk menanyai data lintas katalog, Anda dapat mereferensikan data yang diinginkan dengan menentukan tujuan dalam format nama_katalog.nama_db atau nama_katalog.nama_db.nama_tabel.
Di katalog
default_catalog, jalankan pernyataan berikut untuk menanyai data dari tabelhive_tabledi kataloghive_catalog:SELECT * FROM hive_catalog.hive_db.hive_table;Di katalog
hive_catalog, jalankan pernyataan berikut untuk menanyai data dari tabelolap_tabledi katalogdefault_catalog:SELECT * FROM default_catalog.olap_db.olap_table;Di katalog
hive_catalog, jalankan pernyataan berikut untuk melakukan kueri federasi pada tabelhive_tabledan tabelolap_tabledi katalogdefault_catalog:SELECT * FROM hive_table h JOIN default_catalog.olap_db.olap_table o WHERE h.id = o.id;Di katalog lainnya, jalankan pernyataan berikut untuk melakukan kueri federasi pada tabel
hive_tabledi kataloghive_catalogdan tabelolap_tabledi katalogdefault_catalog:SELECT * FROM hive_catalog.hive_db.hive_table h JOIN default_catalog.olap_db.olap_table o WHERE h.id = o.id;