Kueri SQL di DataAnalysis memungkinkan Anda menulis dan menjalankan pernyataan SQL terhadap berbagai sumber data—MaxCompute, Hologres, EMR, dan lainnya—serta mengekspor atau memvisualisasikan hasilnya tanpa keluar dari Konsol DataWorks.
DataWorks merekomendasikan versi terbaru DataAnalysis untuk fitur terkini dan pengalaman yang lebih baik.
Sumber data yang didukung
Kueri SQL mendukung sumber data berikut: MaxCompute, Hologres, EMR, CDH, StarRocks, ClickHouse, SelectDB, Doris, AnalyticDB for MySQL 3.0, AnalyticDB for PostgreSQL, Tablestore, MySQL, PostgreSQL, Oracle, dan SQL Server.
Hanya sumber data yang ditambahkan ke ruang kerja yang tersedia.
Prasyarat
Sebelum memulai, pastikan Anda telah:
Mendapatkan akses ke setidaknya satu ruang kerja DataWorks yang berisi sumber data yang ingin Anda kueri. Hubungi administrator untuk menambahkan Anda sebagai anggota ruang kerja dengan peran Data Analyst, Model Designer, Developer, O&M, Workspace Administrator, atau Project Owner.
Memiliki izin pada sumber data dalam ruang kerja tersebut (lihat Izin sumber data di bawah).
Izin sumber data
Cakupan sumber data
Anda hanya dapat mengkueri data dari ruang kerja yang memiliki akses.
Mode identitas akses
DataAnalysis mendukung dua mode identitas untuk akses sumber data:
| Mode identitas akses | Deskripsi | Sumber data yang didukung | Cara mendapatkan akses |
|---|---|---|---|
| Executor identity | Akun Alibaba Cloud yang sedang masuk ke DataWorks. | MaxCompute dan Hologres | Minta administrator proyek MaxCompute atau administrator instans Hologres untuk memberikan izin akses anggota kepada Anda. |
| Data source default access identity | Identitas akses yang dikonfigurasi saat sumber data dibuat. | Semua sumber data | Minta pengguna dengan izin Workspace Administrator untuk memberikan akses ke akun Alibaba Cloud Anda saat ini. |
Jika kontrol akses berbasis daftar putih IP diaktifkan untuk proyek MaxCompute, tambahkan daftar putih DataAnalysis ke daftar putih IP proyek MaxCompute.
Buka kueri SQL
Masuk ke DataAnalysis DataWorks, alihkan ke wilayah target, lalu klik Enter DataAnalysis.
Jika bilah navigasi menampilkan Go To New DataAnalysis, Anda berada di halaman DataAnalysis versi lama.
Jika bilah navigasi menampilkan Return To Legacy DataAnalysis, klik untuk kembali ke halaman versi lama. (Tidak disarankan.)
Langkah 1: Tambahkan folder
Tambahkan folder untuk mengelola sumber data dan tabel yang ingin Anda kueri. Setelah menambahkan folder, Anda dapat menelusuri tabelnya, melihat skema tabel, dan menghasilkan pernyataan SQL langsung dari pohon folder.
Pada halaman Analisis SQL, klik ikon
di sebelah kanan kotak pencarian di atas daftar folder.Pilih jenis dataset yang akan ditambahkan:
Jenis dataset Deskripsi Data Map - Metadata Metadata tabel yang dikumpulkan di Data Map. Setiap sumber data atau resource komputasi menjadi satu dataset. Data Map - Data Album Album data yang mengelompokkan tabel berdasarkan subjek. Setiap album data menjadi satu dataset. My Favorites Tabel yang telah Anda tambahkan ke favorit di Data Map. My MaxCompute Tables Semua tabel MaxCompute yang dimiliki oleh akun yang sedang masuk. Public Tables Dataset publik yang disediakan oleh MaxCompute, berguna untuk menghasilkan data uji.
Anda dapat menambahkan hingga 12 dataset. Hapus dataset yang tidak lagi diperlukan agar tetap dalam batas kuota.
Langkah 2: Buat kueri SQL
Kueri berdasarkan katalog data
Pada pohon folder di sebelah kiri, buka dataset yang telah ditambahkan, misalnya My MaxCompute Tables.
Klik kanan tabel yang ingin Anda analisis dan pilih Generate SQL Statement. File sementara berisi pernyataan SQL yang direkomendasikan akan dihasilkan.
Modifikasi pernyataan SQL sesuai kebutuhan, lalu klik Save untuk menyimpan file ke My Files.
Kueri berdasarkan sumber data
Pada pohon folder di sebelah kiri, arahkan kursor ke My Files dan klik ikon
untuk membuat file.Tulis pernyataan SQL di file baru dan simpan ke My Files.
DataWorks secara otomatis melengkapi nama tabel MaxCompute saat Anda mengetik, untuk tabel yang memiliki izin akses oleh akun Anda.
Kueri berdasarkan file SQL yang dibagikan
Pada pohon folder di sebelah kiri, klik Other People's Files untuk menelusuri file SQL yang dibagikan oleh pengguna lain. Buka file tersebut, lalu klik Copy The SQL pada panel detail.
Kueri berdasarkan dataset publik
Setelah menambahkan dataset publik, klik dataset tersebut. Pada panel detail, pilih engine dari bilah atas lalu klik Generate SQL Statement. Dataset publik ditujukan untuk pengujian.
Langkah 3: Konfigurasikan engine kueri dan jalankan kueri
Klik ikon
di pojok kanan atas editor SQL untuk mengonfigurasi engine kueri.Item konfigurasi Deskripsi Workspace Ruang kerja tempat mesin eksekusi berada. Pastikan Anda memiliki akses ke ruang kerja tersebut—jika tidak, hubungi administrator ruang kerja untuk menambahkan Anda sebagai anggota ruang kerja. Data Source Type Jenis mesin eksekusi. Jika tidak ada proyek yang ditentukan dalam pernyataan SQL, engine akan menggunakan sumber data yang dikonfigurasi secara default. Data Source Name Nama mesin eksekusi. Access Identity Mode Pilih Executor Identity (hanya untuk MaxCompute dan Hologres; memerlukan keanggotaan dan izin Select) atau Data Source Default Access Identity (semua sumber data; berikan akses ke akun Anda jika akun Anda berbeda dari identitas yang dikonfigurasi). Klik Run All untuk menjalankan seluruh pernyataan, atau pilih bagian pernyataan tertentu lalu klik Run Selected.
Untuk SQL MaxCompute, perkiraan biaya ditampilkan sebelum eksekusi. Akses perkiraan biaya kapan saja melalui More > Cost Estimate di bilah alat.
Setelah eksekusi, tinjau Run Log, Run Result, dan SQL yang sesuai pada halaman hasil kueri.
Alihkan antara tata letak berdampingan dan atas-bawah menggunakan tombol di pojok kanan atas panel hasil.
Langkah 4: Visualisasikan hasil kueri
Pada bilah alat di sebelah kiri hasil kueri, klik tombol grafik untuk secara otomatis menghasilkan visualisasi dari hasil tersebut.
Klik tombol Copilot di atas grafik untuk mencoba fitur DataWorks Copilot Ask.
Langkah 5: Ekspor dan bagikan
Ekspor hasil kueri ke file lokal, OSS, tabel MaxCompute, buku kerja, atau DingTalk Sheet.
Untuk memindahkan dataset besar antar sumber data, gunakan tugas sinkronisasi offline di Data Integration untuk migrasi data yang lebih andal.
File lokal
Unduh hasil dalam format CSV, TXT, atau XLS.
Saat mengunduh data dalam jumlah besar dari MaxCompute, ubah mode eksekusi SQL ke Run And Generate Temporary Table: klik ikondi pojok kiri bawah menu SQL Query.
| Item | Deskripsi |
|---|---|
| Download limits | Hanya engine MaxCompute dan EMR yang didukung. Untuk informasi lebih lanjut, lihat Jumlah baris data yang dapat diunduh. Jika mekanisme perlindungan data diaktifkan untuk proyek MaxCompute, unduhan akan gagal. Lihat Mengapa hasil kueri atau opsi unduh saya dibatasi? |
| Download scope | Data Displayed In The Table Only hanya mengunduh halaman saat ini, hingga 10.000 catatan. All Data mengekspor semua hasil kueri dalam batas unduh. |
| Download method | Download Without Approval (default, tidak memerlukan permintaan). Download After Approval memerlukan aturan Pendeteksian Penipuan dan mengirimkan permintaan unduh—hanya tersedia di Edisi Perusahaan DataWorks. |
Object Storage Service (OSS)
Ekspor hasil dalam format CSV, teks, ORC, atau Parquet ke bucket Object Storage Service (OSS). Cocok untuk pengarsipan volume besar atau integrasi dengan layanan cloud lainnya.
Pada penggunaan pertama, berikan akses DataWorks ke resource OSS Anda: pada daftar drop-down File path, klik tautan one-click authorization dan ikuti petunjuk untuk menyelesaikan otorisasi RAM.
| Item konfigurasi | Deskripsi |
|---|---|
| File path | Klik ikon folder untuk memilih bucket dan folder OSS tempat file output disimpan. |
| File name | Dihasilkan otomatis oleh sistem. Edit sesuai kebutuhan. |
| Text type | Format ekspor: csv, text, orc, atau parquet. |
| Separator | Pembatas kolom. Default: koma (,). |
| Encoding format | Enkode file: UTF-8 atau GBK. |
| CU | Unit komputasi (CU) untuk tugas ekspor. Default: 1 CU. |
| Resource group | Kelompok sumber daya serverless untuk tugas ekspor. Jika dibiarkan kosong, akan menggunakan kelompok sumber daya integrasi data yang dikonfigurasi di DataAnalysis > System Administration. |
Klik OK untuk memulai ekspor. Pantau progres, log eksekusi, dan konfigurasi di halaman tugas. Setelah tugas berhasil, unduh file yang diekspor dari konsol OSS.
Tabel MaxCompute
Simpan hasil langsung ke tabel MaxCompute—tanpa perlu mengunduh lokal atau mengunggah ulang. Atur siklus hidup tabel sesuai kebutuhan.
Opsi ini hanya muncul saat mengkueri engine MaxCompute.
Buku kerja
Simpan hasil ke buku kerja untuk analisis data lebih lanjut dan bagikan hasil analisis terbaru kepada orang lain.
DingTalk Sheet
Ekspor hasil ke DingTalk Sheet.
Operasi lainnya
Kelola versi file SQL
Pada halaman pengeditan file SQL, klik More > Version di bilah alat atas untuk membandingkan versi yang disimpan otomatis dan versi yang disimpan manual serta memilih versi yang ingin Anda simpan.
Cari kode
Di atas pohon folder, klik
dan masukkan kata kunci untuk mencari di seluruh file SQL. Tersedia di Edisi Standar DataWorks dan versi setelahnya.
Lihat riwayat eksekusi
Di atas pohon folder, klik
untuk melihat catatan eksekusi kueri SQL historis.
FAQ
Bagaimana cara memberikan izin identitas akses default untuk sumber data?
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah target. Di panel navigasi kiri, pilih Data Governance > Security Center, lalu klik Go to Security Center.
Di panel navigasi kiri, klik Security Policy > Data Query And Analysis Control.
Alihkan ke ruang kerja target, temukan sumber data, lalu klik Authorize untuk memberikan akses.

Mengapa kueri SQL gagal dengan pesan "This node can only run on exclusive resource groups"?
Buka DataAnalysis > More > System Administration dan konfigurasikan Schedule Resource Group dan Data Integration Resource Group untuk engine tersebut.
Mengapa hasil kueri atau opsi unduh saya dibatasi?
Hanya sebagian hasil yang ditampilkan secara default. Untuk menyesuaikan batasan:
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah target. Di panel navigasi kiri, pilih Data Governance > Security Center, lalu klik Go to Security Center.
Di panel navigasi kiri, klik Security Policy > Data Query And Analysis Control.
Pada tab Query Result Control, sesuaikan Maximum value of single display record, Maximum value of single copy record, Maximum value of single download record, dan Allow Downloads.

Untuk detail lebih lanjut, lihat Kontrol kueri dan analisis data.