Topik ini menjelaskan cara menggunakan Data Lake Formation (DLF) untuk menulis data dari tabel internal Hologres kembali ke Object Storage Service (OSS) dengan menjalankan pernyataan SQL, serta cara meminta data yang telah ditulis menggunakan mesin eksternal.
Prasyarat
DLF harus sudah diaktifkan dan konfigurasi lingkungan selesai. Pastikan bahwa tabel asing Hologres dapat digunakan untuk membaca data dari OSS. Untuk informasi lebih lanjut, lihat bagian Prosedur dari topik "Gunakan DLF untuk membaca data dari dan menulis data ke OSS".
Ekspor data ke danau data
Jika data diperbarui, Anda perlu menulis ulang data tersebut ke OSS dan memprosesnya menggunakan mesin eksternal seperti E-MapReduce (EMR). Anda dapat menjalankan pernyataan SQL untuk langsung menyisipkan data ke OSS menggunakan tabel asing.
Data hanya dapat diekspor dalam format berikut: ORC, Parquet, CSV, SequenceFile, Hudi, dan Paimon.
Tulis ulang data ke OSS.
Jalankan pernyataan SQL berikut untuk menulis data dari tabel internal Hologres kembali ke OSS:
INSERT INTO <foreign_table_name>(<col_name>,......) SELECT <col_name>,...... FROM <holo_table_name>;Tabel berikut menjelaskan parameter dalam pernyataan SQL:
Parameter
Deskripsi
foreign_table_name
Nama tabel asing.
holo_table_name
Nama tabel internal Hologres.
col_name
Nama kolom.
Minta data yang telah ditulis kembali ke OSS.
Setelah data ditulis kembali ke OSS, jalankan pernyataan SQL berikut di mesin Hive atau Spark EMR untuk meminta data yang telah ditulis:
SELECT * FROM <foreign_table_name> WHERE <col_name> = value;Jika pesan sukses dikembalikan, Hologres telah berhasil menulis data kembali ke OSS dan EMR dapat membaca data tersebut.