MaxCompute SQL adalah dialek SQL yang digunakan di MaxCompute untuk kueri dan analisis data skala besar. Dialek ini memperluas standar ANSI SQL-92 dengan fitur-fitur yang dirancang khusus untuk skenario gudang data skala besar.
Kapan menggunakan MaxCompute SQL
MaxCompute SQL dirancang untuk pekerjaan batch yang memproses data dalam skala gigabyte, terabyte, atau exabyte. Setelah Anda mengirimkan pekerjaan, penjadwalan antrian dapat menimbulkan jeda mulai dari puluhan detik hingga beberapa menit sebelum eksekusi dimulai—rencanakan alur kerja Anda sesuai dengan hal tersebut.
MaxCompute SQL tidak ditujukan untuk sistem OLTP atau aplikasi yang memerlukan ribuan hingga puluhan ribu transaksi per detik. Untuk beban kerja tersebut, gunakan database transaksional sebagai gantinya.
Perbedaan MaxCompute SQL dengan SQL standar
Jika Anda memiliki latar belakang Hive, MySQL, atau Oracle, mulailah dengan dua topik berikut sebelum menulis SQL apa pun:
Perbedaan dalam dukungan pernyataan SQL — kesenjangan sintaks antara MaxCompute SQL dan database utama
Pemetaan tipe data antara MaxCompute dan Hive, MySQL, serta Oracle — kompatibilitas tipe data lintas database
Kedua topik ini mencakup celah kompatibilitas yang paling mungkin memengaruhi kode SQL yang sudah ada.
Referensi bahasa
Fundamental bahasa
| Topik | Deskripsi |
|---|---|
| Perbedaan dalam dukungan pernyataan SQL | Perbedaan sintaks antara MaxCompute SQL dan database utama |
| Kata tercadang dan kata kunci | Kata tercadang dan kata kunci dalam MaxCompute SQL |
| Tipe data | Tipe data yang didukung, edisi, serta perbedaan antar edisi |
| Konversi tipe | Konversi tipe yang didukung oleh MaxCompute SQL |
| Pemetaan tipe data antara MaxCompute dan Hive, MySQL, serta Oracle | Kompatibilitas tipe data lintas database |
| Karakter escape | Sintaks karakter escape dalam MaxCompute SQL |
| LIKE | Karakter yang didukung oleh operator LIKE untuk pencocokan pola |
| RLIKE | Karakter yang didukung oleh operator RLIKE untuk pencocokan regex |
| Operator | Operator relasional, aritmetika, bitwise, dan logika |
Pernyataan SQL
| Topik | Deskripsi |
|---|---|
| Batasan | Batasan yang harus diikuti saat menulis skrip MaxCompute SQL |
| Pernyataan DDL | Sintaks untuk membuat dan mengelola tabel, partisi, kolom, serta siklus hidup |
| Pernyataan DML | INSERT INTO dan INSERT OVERWRITE sintaks |
| Pernyataan DQL | SELECT sintaks pernyataan untuk mengkueri data |
| Sintaks SQL yang ditingkatkan | LOAD dan UNLOAD pernyataan untuk meningkatkan keterbacaan dan efisiensi eksekusi |
| Jalankan MaxCompute SQL dalam mode skrip | Kompilasi skrip SQL dalam mode skrip |
Ekstensibilitas
| Topik | Deskripsi |
|---|---|
| MaxCompute UDF | Buat user-defined function (UDF), user-defined table-valued function (UDTF), dan Fungsi agregat yang didefinisikan pengguna (UDAF) untuk memperluas SQL dengan logika kustom |
| MaxCompute UDT | Panggil kelas dan metode dari bahasa pemrograman pihak ketiga secara langsung dalam SQL |
| MaxCompute UDJ | Lakukan operasi kustom lintas tabel atau pada beberapa tabel |
Tool pengembangan
Pilih tool berdasarkan kompleksitas pekerjaan dan alur kerja tim:
| Tool | Paling cocok untuk |
|---|---|
| Klien MaxCompute | Pekerjaan sederhana |
| MaxCompute Studio | Pekerjaan kompleks |
| Konsol DataWorks | Pekerjaan kompleks |