All Products
Search
Document Center

Object Storage Service:Gunakan Trino pada kluster EMR untuk mengkueri data yang disimpan di OSS-HDFS

Last Updated:Feb 28, 2026

OSS-HDFS menyediakan antarmuka yang kompatibel dengan HDFS sehingga mesin data besar seperti Trino dapat mengakses data OSS secara langsung. Siapkan Trino pada kluster E-MapReduce (EMR) untuk menjalankan kueri SQL interaktif terhadap data yang disimpan di OSS-HDFS.

Prasyarat

Sebelum memulai, pastikan Anda telah memiliki:

  • Kluster EMR versi EMR V3.42.0 atau lebih baru, atau EMR V5.8.0 atau lebih baru, dengan layanan Trino yang dipilih. Untuk informasi selengkapnya, lihat Create a cluster.

  • Bucket dengan OSS-HDFS yang diaktifkan dan izin akses yang diperlukan telah diberikan. Untuk informasi selengkapnya, lihat Enable OSS-HDFS and grant access permissions.

Langkah 1: Buat kluster EMR

  1. Masuk ke Konsol EMR. Di panel navigasi sebelah kiri, klik EMR on ECS.

  2. Buat kluster EMR dengan pengaturan berikut:

    ParameterNilai yang Diperlukan
    Product VersionEMR-3.46.2 atau lebih baru, atau EMR-5.12.2 atau lebih baru
    Root Storage Directory of ClusterBucket dengan OSS-HDFS yang diaktifkan
    Parameter lainnyaNilai default

    Untuk informasi selengkapnya, lihat Create a cluster.

Langkah 2: Hubungkan ke server Trino

  1. Dapatkan alamat dan port server Trino:

    1. Pada halaman EMR on ECS, klik nama kluster Anda.

    2. Buka Services > Trino > Configure untuk menemukan alamat dan port server.

  2. Jalankan perintah berikut untuk menghubungkan ke server Trino:

    ParameterDeskripsi
    <Trino_server_address>Alamat IP atau hostname server Trino. Terletak di tab Configure.
    <Trino_server_port>Nomor port server Trino. Terletak di tab Configure.
    <catalog_name>Katalog yang akan dihubungkan, misalnya hive.
       trino --server <Trino_server_address>:<Trino_server_port> --catalog <catalog_name>
    Catatan: Flag --catalog memerlukan nilai. Tentukan katalog yang memetakan ke sumber data Anda.

Langkah 3: Kueri data yang disimpan di OSS-HDFS

Setelah terhubung ke server Trino, jalankan pernyataan SQL berikut untuk membuat skema, memuat data, dan menjalankan kueri.

  1. Buat skema yang mengarah ke lokasi OSS-HDFS.

       create schema testDB with (location='oss://<Bucket>.<Endpoint>/<schema_dir>');

    Ganti placeholder dengan nilai Anda:

    PlaceholderDeskripsiContoh
    <Bucket>Nama bucket OSS dengan OSS-HDFS yang diaktifkanmy-data-bucket
    <Endpoint>Titik akhir OSS-HDFS untuk wilayah Andacn-hangzhou.oss-dls.aliyuncs.com
    <schema_dir>Jalur direktori untuk skematrino/testDB

    URI lengkap mengikuti format berikut:

       oss://<Bucket>.<Endpoint>/<schema_dir>
  2. Beralih ke skema baru.

       use testDB;
  3. Buat tabel.

       create table tbl (key int, val int);
  4. Masukkan data ke dalam tabel.

       insert into tbl values (1,666);
  5. Kueri data dalam tabel.

       select * from tbl;

    Output yang diharapkan:

        key | val
       -----+-----
          1 | 666
       (1 row)

Hasil

Kueri mengembalikan baris yang telah Anda masukkan. Data tersebut disimpan di lokasi OSS-HDFS yang ditentukan dalam skema.

Referensi