全部产品
Search
文档中心

Hologres:Apache Nifi

更新时间:Jul 02, 2025

Topik ini memberikan contoh untuk menjelaskan cara menghubungkan Apache Nifi ke Hologres.

Informasi latar belakang

Apache NiFi adalah platform pemrosesan dan distribusi data yang andal serta mudah digunakan. Platform ini dirancang untuk memfasilitasi manajemen otomatis aliran data di seluruh sistem. Apache NiFi memiliki antarmuka pengguna berbasis web (UI) yang interaktif dan ramah pengguna. Anda dapat menggunakan Apache NiFi untuk mengelola dan memproses aliran data dalam satu sistem atau di beberapa sistem.

Prasyarat

Impor file JSON lokal ke Hologres

Gambar berikut menunjukkan cara mengimpor file JSON lokal ke Hologres.Flowchart

  1. Prosesor GetFile: membaca file JSON.

  2. Prosesor ConvertJSONToSQL: menghasilkan pernyataan INSERT berdasarkan data dalam file JSON.

  3. Prosesor PutSQL: mengeksekusi pernyataan INSERT yang dihasilkan untuk mengimpor data dalam file JSON ke database di Hologres.

  1. Buat database dan tabel di Hologres.

    1. Masuk ke instans Hologres Anda dan buat database bernama demo. Untuk informasi lebih lanjut, lihat Buat database.

    2. Buat tabel.

      Eksekusi pernyataan berikut untuk membuat tabel tempat data dalam file JSON akan diimpor.

      DROP TABLE IF EXISTS user_info;
      
      CREATE TABLE IF NOT EXISTS user_info (
          id int,
          first_name text,
          last_name text,
          email text
      );
  2. Konfigurasikan prosesor GetFile.

    1. Tambahkan prosesor GetFile.

      Untuk informasi lebih lanjut, lihat Ikhtisar Apache NiFi.

    2. Tentukan jalur file JSON.

      Pada kolom Nilai yang sesuai dengan properti Input Directory pada tab PROPERTIES, tentukan jalur file JSON. Dalam contoh ini, file JSON bernama user_info.json disimpan di direktori /opt/nifi/nifi-current/file_source server Apache NiFi. Informasi berikut menunjukkan data dalam file JSON:

      {
          "id": 1,
          "first_name": "Sig",
          "last_name": "Olivo",
          "email": "solivo0@blinklist.com"
      }

      Gambar berikut menunjukkan cara menentukan jalur file JSON.getfile processor

    3. Klik APPLY untuk menyimpan konfigurasi.

  3. Konfigurasikan prosesor ConvertJSONToSQL.

    1. Tambahkan prosesor ConvertJSONToSQL.

    2. Tambahkan layanan kontroler di JDBC Connection Pool. Saat menambahkan layanan tersebut, atur parameter Compatible Controller Services menjadi DBCPConnectionPool 1.16.0 dan parameter Controller Service Name menjadi hologres.

      addcontrollerservice

    3. Di sebelah kanan DBCPConnectionPool, klik panah kanan untuk mengonfigurasi string koneksi.

    4. Temukan layanan kontroler DBCPConnectionPool yang Anda tambahkan dan klik ikon Pengaturan di sebelah kanan.

      Configure DBCPConnectionPool

    5. Klik tab PROPERTIES. Pada tab PROPERTIES, atur properti sesuai kebutuhan. Tabel berikut menjelaskan propertinya.

      Set the parameters

      Parameter

      Deskripsi

      Catatan

      URL Koneksi Database

      String koneksi JDBC yang Anda gunakan untuk terhubung ke instans Hologres. Format: jdbc:postgresql://<endpoint>/<nama database>. Contoh: jdbc:postgresql://hgpostcn-cn-xxxxxxxxxxx-cn-shanghai.hologres.aliyuncs.com:80/demo.

      Endpoint dalam string koneksi harus merupakan endpoint publik atau virtual private cloud (VPC) dari instans Hologres. Untuk mendapatkan endpoint, masuk ke Konsol Hologres dan buka halaman detail instans.

      Nama Kelas Driver Database

      Nama kelas driver. Atur properti ini menjadi org.postgresql.Driver.

      Tidak tersedia

      Lokasi Driver Database

      Jalur driver JDBC yang Anda gunakan untuk terhubung ke database Hologres. Contoh: /opt/nifi/nifi-current/jdbc_driver/postgresql-42.3.4.jar.

      Anda dapat mengunduh driver JDBC dari situs resmi PostgreSQL. Kami merekomendasikan Anda mengunduh driver JDBC versi 42.2.25 atau versi yang lebih baru.

      Pengguna Database

      ID AccessKey akun Alibaba Cloud Anda.

      Anda dapat memperoleh ID AccessKey dari halaman AccessKey.

      Kata Sandi

      Rahasia AccessKey akun Alibaba Cloud Anda.

    6. Klik OK.

    7. Klik ENABLE untuk memulai layanan kontroler.

    8. Kembali ke halaman tempat Anda mengonfigurasi prosesor ConvertJSONToSQL dan modifikasi parameter. Tabel berikut menjelaskan parameter. Untuk informasi lebih lanjut, lihat Ikhtisar Apache NiFi.

      Parameter

      Deskripsi

      Tipe Pernyataan

      Tipe pernyataan. Dalam contoh ini, parameter ini diatur menjadi INSERT.

      Nama Tabel

      Nama tabel Hologres tempat data dalam file JSON akan diimpor. Dalam contoh ini, nama tabel adalah user_info.

      Nama Skema

      Nama skema tempat tabel Hologres berada. Dalam contoh ini, nama skema adalah public.

    9. Klik APPLY untuk menyimpan konfigurasi.

  4. Konfigurasikan prosesor PutSQL.

    1. Tambahkan prosesor PutSQL.

    2. Atur parameter JDBC Connection Pool menjadi layanan kontroler DBCPConnectionPool yang Anda tambahkan di langkah 3.ii. Dalam contoh ini, nama layanan kontroler DBCPConnectionPool adalah hologres.

    3. Atur parameter Support Fragmented Transactions menjadi false.

    4. Klik APPLY untuk menyimpan konfigurasi.

  5. Impor data dalam file JSON.

    Jalankan prosesor yang Anda konfigurasikan di langkah-langkah sebelumnya. Kemudian, Apache NiFi membaca data dalam file JSON dan mengimpor data tersebut ke Hologres.Import the data in the JSON file

  6. Kueri data.

    Di Hologres, eksekusi pernyataan berikut untuk menanyakan tabel bernama user_info:

    SELECT * FROM user_info;

    Gambar berikut menunjukkan hasil kueri.Query results