All Products
Search
Document Center

DataWorks:Kueri dan analisis SQL (versi lama)

Last Updated:Mar 26, 2026

Kueri SQL di DataAnalysis memungkinkan Anda menulis dan menjalankan pernyataan SQL terhadap berbagai sumber data—MaxCompute, Hologres, EMR, dan lainnya—serta mengekspor atau memvisualisasikan hasilnya tanpa keluar dari Konsol DataWorks.

Penting

DataWorks merekomendasikan versi terbaru DataAnalysis untuk fitur terkini dan pengalaman yang lebih baik.

Sumber data yang didukung

Kueri SQL mendukung sumber data berikut: MaxCompute, Hologres, EMR, CDH, StarRocks, ClickHouse, SelectDB, Doris, AnalyticDB for MySQL 3.0, AnalyticDB for PostgreSQL, Tablestore, MySQL, PostgreSQL, Oracle, dan SQL Server.

Penting

Hanya sumber data yang ditambahkan ke ruang kerja yang tersedia.

Prasyarat

Sebelum memulai, pastikan Anda telah:

  • Mendapatkan akses ke setidaknya satu ruang kerja DataWorks yang berisi sumber data yang ingin Anda kueri. Hubungi administrator untuk menambahkan Anda sebagai anggota ruang kerja dengan peran Data Analyst, Model Designer, Developer, O&M, Workspace Administrator, atau Project Owner.

  • Memiliki izin pada sumber data dalam ruang kerja tersebut (lihat Izin sumber data di bawah).

Izin sumber data

Cakupan sumber data

Anda hanya dapat mengkueri data dari ruang kerja yang memiliki akses.

Mode identitas akses

DataAnalysis mendukung dua mode identitas untuk akses sumber data:

Mode identitas aksesDeskripsiSumber data yang didukungCara mendapatkan akses
Executor identityAkun Alibaba Cloud yang sedang masuk ke DataWorks.MaxCompute dan HologresMinta administrator proyek MaxCompute atau administrator instans Hologres untuk memberikan izin akses anggota kepada Anda.
Data source default access identityIdentitas akses yang dikonfigurasi saat sumber data dibuat.Semua sumber dataMinta pengguna dengan izin Workspace Administrator untuk memberikan akses ke akun Alibaba Cloud Anda saat ini.
Penting

Jika kontrol akses berbasis daftar putih IP diaktifkan untuk proyek MaxCompute, tambahkan daftar putih DataAnalysis ke daftar putih IP proyek MaxCompute.

Buka kueri SQL

Masuk ke DataAnalysis DataWorks, alihkan ke wilayah target, lalu klik Enter DataAnalysis.

  • Jika bilah navigasi menampilkan Go To New DataAnalysis, Anda berada di halaman DataAnalysis versi lama.

  • Jika bilah navigasi menampilkan Return To Legacy DataAnalysis, klik untuk kembali ke halaman versi lama. (Tidak disarankan.)

Langkah 1: Tambahkan folder

Tambahkan folder untuk mengelola sumber data dan tabel yang ingin Anda kueri. Setelah menambahkan folder, Anda dapat menelusuri tabelnya, melihat skema tabel, dan menghasilkan pernyataan SQL langsung dari pohon folder.

  1. Pada halaman Analisis SQL, klik ikon image di sebelah kanan kotak pencarian di atas daftar folder.

  2. Pilih jenis dataset yang akan ditambahkan:

    Jenis datasetDeskripsi
    Data Map - MetadataMetadata tabel yang dikumpulkan di Data Map. Setiap sumber data atau resource komputasi menjadi satu dataset.
    Data Map - Data AlbumAlbum data yang mengelompokkan tabel berdasarkan subjek. Setiap album data menjadi satu dataset.
    My FavoritesTabel yang telah Anda tambahkan ke favorit di Data Map.
    My MaxCompute TablesSemua tabel MaxCompute yang dimiliki oleh akun yang sedang masuk.
    Public TablesDataset publik yang disediakan oleh MaxCompute, berguna untuk menghasilkan data uji.
Anda dapat menambahkan hingga 12 dataset. Hapus dataset yang tidak lagi diperlukan agar tetap dalam batas kuota.

Langkah 2: Buat kueri SQL

Kueri berdasarkan katalog data

  1. Pada pohon folder di sebelah kiri, buka dataset yang telah ditambahkan, misalnya My MaxCompute Tables.

  2. Klik kanan tabel yang ingin Anda analisis dan pilih Generate SQL Statement. File sementara berisi pernyataan SQL yang direkomendasikan akan dihasilkan.

  3. Modifikasi pernyataan SQL sesuai kebutuhan, lalu klik Save untuk menyimpan file ke My Files.

Kueri berdasarkan sumber data

  1. Pada pohon folder di sebelah kiri, arahkan kursor ke My Files dan klik ikon image untuk membuat file.

  2. Tulis pernyataan SQL di file baru dan simpan ke My Files.

DataWorks secara otomatis melengkapi nama tabel MaxCompute saat Anda mengetik, untuk tabel yang memiliki izin akses oleh akun Anda.

Kueri berdasarkan file SQL yang dibagikan

Pada pohon folder di sebelah kiri, klik Other People's Files untuk menelusuri file SQL yang dibagikan oleh pengguna lain. Buka file tersebut, lalu klik Copy The SQL pada panel detail.

Kueri berdasarkan dataset publik

Setelah menambahkan dataset publik, klik dataset tersebut. Pada panel detail, pilih engine dari bilah atas lalu klik Generate SQL Statement. Dataset publik ditujukan untuk pengujian.

Langkah 3: Konfigurasikan engine kueri dan jalankan kueri

  1. Klik ikon image di pojok kanan atas editor SQL untuk mengonfigurasi engine kueri.

    Item konfigurasiDeskripsi
    WorkspaceRuang kerja tempat mesin eksekusi berada. Pastikan Anda memiliki akses ke ruang kerja tersebut—jika tidak, hubungi administrator ruang kerja untuk menambahkan Anda sebagai anggota ruang kerja.
    Data Source TypeJenis mesin eksekusi. Jika tidak ada proyek yang ditentukan dalam pernyataan SQL, engine akan menggunakan sumber data yang dikonfigurasi secara default.
    Data Source NameNama mesin eksekusi.
    Access Identity ModePilih Executor Identity (hanya untuk MaxCompute dan Hologres; memerlukan keanggotaan dan izin Select) atau Data Source Default Access Identity (semua sumber data; berikan akses ke akun Anda jika akun Anda berbeda dari identitas yang dikonfigurasi).
  2. Klik Run All untuk menjalankan seluruh pernyataan, atau pilih bagian pernyataan tertentu lalu klik Run Selected.

    Untuk SQL MaxCompute, perkiraan biaya ditampilkan sebelum eksekusi. Akses perkiraan biaya kapan saja melalui More > Cost Estimate di bilah alat.
  3. Setelah eksekusi, tinjau Run Log, Run Result, dan SQL yang sesuai pada halaman hasil kueri.

    Alihkan antara tata letak berdampingan dan atas-bawah menggunakan tombol di pojok kanan atas panel hasil.

Langkah 4: Visualisasikan hasil kueri

Pada bilah alat di sebelah kiri hasil kueri, klik tombol grafik untuk secara otomatis menghasilkan visualisasi dari hasil tersebut.

Klik tombol Copilot di atas grafik untuk mencoba fitur DataWorks Copilot Ask.

Langkah 5: Ekspor dan bagikan

Ekspor hasil kueri ke file lokal, OSS, tabel MaxCompute, buku kerja, atau DingTalk Sheet.

Penting

Untuk memindahkan dataset besar antar sumber data, gunakan tugas sinkronisasi offline di Data Integration untuk migrasi data yang lebih andal.

File lokal

Unduh hasil dalam format CSV, TXT, atau XLS.

Saat mengunduh data dalam jumlah besar dari MaxCompute, ubah mode eksekusi SQL ke Run And Generate Temporary Table: klik ikon Settings di pojok kiri bawah menu SQL Query.
ItemDeskripsi
Download limitsHanya engine MaxCompute dan EMR yang didukung. Untuk informasi lebih lanjut, lihat Jumlah baris data yang dapat diunduh. Jika mekanisme perlindungan data diaktifkan untuk proyek MaxCompute, unduhan akan gagal. Lihat Mengapa hasil kueri atau opsi unduh saya dibatasi?
Download scopeData Displayed In The Table Only hanya mengunduh halaman saat ini, hingga 10.000 catatan. All Data mengekspor semua hasil kueri dalam batas unduh.
Download methodDownload Without Approval (default, tidak memerlukan permintaan). Download After Approval memerlukan aturan Pendeteksian Penipuan dan mengirimkan permintaan unduh—hanya tersedia di Edisi Perusahaan DataWorks.

Object Storage Service (OSS)

Ekspor hasil dalam format CSV, teks, ORC, atau Parquet ke bucket Object Storage Service (OSS). Cocok untuk pengarsipan volume besar atau integrasi dengan layanan cloud lainnya.

Pada penggunaan pertama, berikan akses DataWorks ke resource OSS Anda: pada daftar drop-down File path, klik tautan one-click authorization dan ikuti petunjuk untuk menyelesaikan otorisasi RAM.
Item konfigurasiDeskripsi
File pathKlik ikon folder untuk memilih bucket dan folder OSS tempat file output disimpan.
File nameDihasilkan otomatis oleh sistem. Edit sesuai kebutuhan.
Text typeFormat ekspor: csv, text, orc, atau parquet.
SeparatorPembatas kolom. Default: koma (,).
Encoding formatEnkode file: UTF-8 atau GBK.
CUUnit komputasi (CU) untuk tugas ekspor. Default: 1 CU.
Resource groupKelompok sumber daya serverless untuk tugas ekspor. Jika dibiarkan kosong, akan menggunakan kelompok sumber daya integrasi data yang dikonfigurasi di DataAnalysis > System Administration.

Klik OK untuk memulai ekspor. Pantau progres, log eksekusi, dan konfigurasi di halaman tugas. Setelah tugas berhasil, unduh file yang diekspor dari konsol OSS.

Tabel MaxCompute

Simpan hasil langsung ke tabel MaxCompute—tanpa perlu mengunduh lokal atau mengunggah ulang. Atur siklus hidup tabel sesuai kebutuhan.

Opsi ini hanya muncul saat mengkueri engine MaxCompute.

Buku kerja

Simpan hasil ke buku kerja untuk analisis data lebih lanjut dan bagikan hasil analisis terbaru kepada orang lain.

DingTalk Sheet

Ekspor hasil ke DingTalk Sheet.

Operasi lainnya

Kelola versi file SQL

Pada halaman pengeditan file SQL, klik More > Version di bilah alat atas untuk membandingkan versi yang disimpan otomatis dan versi yang disimpan manual serta memilih versi yang ingin Anda simpan.

Cari kode

Di atas pohon folder, klik image.png dan masukkan kata kunci untuk mencari di seluruh file SQL. Tersedia di Edisi Standar DataWorks dan versi setelahnya.

Lihat riwayat eksekusi

Di atas pohon folder, klik 历史 untuk melihat catatan eksekusi kueri SQL historis.

FAQ

Bagaimana cara memberikan izin identitas akses default untuk sumber data?

  1. Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah target. Di panel navigasi kiri, pilih Data Governance > Security Center, lalu klik Go to Security Center.

  2. Di panel navigasi kiri, klik Security Policy > Data Query And Analysis Control.

  3. Alihkan ke ruang kerja target, temukan sumber data, lalu klik Authorize untuk memberikan akses.

    管控数据源

Mengapa kueri SQL gagal dengan pesan "This node can only run on exclusive resource groups"?

Buka DataAnalysis > More > System Administration dan konfigurasikan Schedule Resource Group dan Data Integration Resource Group untuk engine tersebut.

Mengapa hasil kueri atau opsi unduh saya dibatasi?

Hanya sebagian hasil yang ditampilkan secara default. Untuk menyesuaikan batasan:

  1. Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah target. Di panel navigasi kiri, pilih Data Governance > Security Center, lalu klik Go to Security Center.

  2. Di panel navigasi kiri, klik Security Policy > Data Query And Analysis Control.

  3. Pada tab Query Result Control, sesuaikan Maximum value of single display record, Maximum value of single copy record, Maximum value of single download record, dan Allow Downloads.

    image

Untuk detail lebih lanjut, lihat Kontrol kueri dan analisis data.