全部产品
Search
文档中心

DataWorks:Kueri dan analisis SQL (Lama)

更新时间:Dec 15, 2025

Anda dapat menggunakan pernyataan SQL untuk mengkueri dan menganalisis data secara cepat dari sumber seperti MaxCompute, EMR Hive, dan Hologres. Topik ini menjelaskan cara mengkueri sumber data menggunakan pernyataan SQL.

Penting

DataWorks merekomendasikan agar Anda mencoba versi terbaru DataAnalysis untuk mengakses fitur-fitur terkini dan menikmati pengalaman pengguna yang lebih baik.

Sumber data yang didukung

Kueri SQL mendukung sumber data seperti MaxCompute, Hologres, EMR, CDH, StarRocks, ClickHouse, SelectDB, Doris, AnalyticDB for MySQL 3.0, AnalyticDB for PostgreSQL, Tablestore, MySQL, PostgreSQL, Oracle, dan SQL Server.

Penting

Hanya sumber data yang ditambahkan ke ruang kerja yang didukung.

Izin sumber data

Cakupan sumber data

Anda hanya dapat mengkueri data dari sumber data dalam ruang kerja yang memberikan izin kepada Anda. Hubungi administrator untuk menambahkan Anda ke ruang kerja sebagai Analis Data, Perancang Model, Pengembang, O&M, Administrator Ruang Kerja, atau Pemilik Proyek.

Izin akses sumber data

Akses sumber data mendukung dua mode identitas berikut.

Mode identitas akses

Deskripsi

Sumber data yang didukung

Otorisasi

Executor Identity

Identitas akun Alibaba Cloud yang saat ini masuk ke DataWorks.

MaxCompute dan Hologres.

Minta administrator proyek MaxCompute atau instans Hologres yang ditentukan untuk memberikan izin akses anggota kepada Anda.

Default Access Identity of the Data Source

Identitas akses yang dikonfigurasi saat sumber data dibuat.

Semua sumber data.

Jika akun Anda bukan identitas akses default untuk sumber data tersebut, mintalah pengguna dengan izin Administrator Ruang Kerja untuk memberikan izin tersebut ke akun Alibaba Cloud Anda.

Penting

Jika kontrol akses berbasis daftar putih diaktifkan untuk proyek MaxCompute, Anda harus menambahkan daftar putih DataAnalysis ke daftar putih alamat IP proyek MaxCompute.

Titik masuk

Masuk ke DataAnalysis DataWorks, beralih ke wilayah tujuan, lalu klik Enter DataAnalysis.

  • Jika Anda melihat Go To New DataAnalysis di bilah navigasi, Anda berada di halaman DataAnalysis versi lama.

  • (Tidak disarankan) Jika Anda melihat Return To Legacy DataAnalysis di bilah navigasi, Anda dapat mengkliknya untuk kembali ke halaman DataAnalysis versi lama.

Langkah 1: Tambahkan folder

Anda dapat menambahkan folder dan tabel yang direkomendasikan sistem dari sumber data yang telah diberi otorisasi ke daftar folder Anda. Setelah folder ditambahkan, Anda dapat dengan cepat melihat tabel beserta skema tabelnya serta menghasilkan pernyataan kueri SQL.

  1. Pada halaman Analisis SQL, klik ikon image di sebelah kanan kotak pencarian di atas daftar folder untuk menambahkan folder.

    • Data Map - Metadata: Metadata tabel yang dikumpulkan di Data Map. Setiap sumber data atau sumber daya komputasi dapat ditambahkan sebagai set data.

    • Data Map - Data Albums: Album data di Data Map yang mengelompokkan tabel berdasarkan subjek. Setiap album data dapat ditambahkan sebagai set data.

    • My Favorites: Tabel yang telah Anda tambahkan ke favorit di Data Map.

    • My MaxCompute Tables: Semua tabel MaxCompute yang pemiliknya adalah akun yang sedang masuk.

    • Public Data: Dataset publik yang disediakan oleh MaxCompute yang dapat Anda gunakan untuk menghasilkan data uji secara cepat.

    Catatan

    Anda dapat menambahkan hingga 12 set data. Anda dapat menghapus set data yang tidak lagi diperlukan.

Langkah 2: Buat kueri SQL

Kueri berdasarkan katalog data

Setelah Anda menambahkan folder data, set data yang sesuai akan muncul di pohon folder di sebelah kiri.

  1. Di pohon folder di sebelah kiri, klik untuk membuka set data yang telah ditambahkan, misalnya My MaxCompute Tables.

  2. Klik kanan nama tabel yang ingin Anda analisis dan pilih Generate SQL Statement. File sementara yang berisi pernyataan SQL yang direkomendasikan untuk tabel tersebut akan dihasilkan.

  3. Modifikasi pernyataan SQL sesuai kebutuhan dan klik Save untuk menyimpan file sementara ke My Files.

Kueri berdasarkan sumber data

  1. Di pohon folder di sebelah kiri, arahkan penunjuk tetikus ke My Files dan klik ikon image di sebelah kanan untuk membuat file.

  2. Tulis pernyataan kueri SQL di file baru dan simpan ke My Files.

    Catatan

    Saat Anda mengedit pernyataan SQL, DataWorks secara otomatis melengkapi nama tabel MaxCompute yang Anda miliki izinnya.

Kueri berdasarkan file SQL bersama

Di pohon folder di sebelah kiri, klik Files From Others untuk melihat file SQL yang dibagikan oleh pengguna lain. Klik file SQL tersebut, lalu klik Copy The SQL pada halaman detail yang muncul di sebelah kanan.

Kueri berdasarkan dataset publik

Setelah Anda menambahkan dataset publik ke daftar folder, klik dataset tersebut. Di halaman detail yang muncul di sebelah kanan, pilih mesin DPI dari bilah atas, lalu klik Generate An SQL Statement. Anda dapat menggunakan dataset publik untuk pengujian.

Langkah 3: Konfigurasi mesin kueri dan jalankan kueri

  1. Klik ikon image di pojok kanan atas halaman detail SQL untuk mengonfigurasi mesin kueri SQL.

    Item konfigurasi

    Deskripsi

    Workspace

    Ruang kerja tempat mesin eksekusi berada.

    Penting

    Pastikan Anda memiliki izin akses ke ruang kerja tersebut. Jika tidak, hubungi administrator ruang kerja untuk menambahkan Anda sebagai anggota ruang kerja.

    Data Source Type

    Jenis dan nama mesin eksekusi.

    Penting

    Jika tidak ada proyek yang ditentukan dalam pernyataan SQL, mesin eksekusi menjadi sumber data default.

    Data Source Name

    Access Identity Mode

    Pilih mode akses untuk kueri SQL:

    • Executor Identity: Hanya mendukung mesin MaxCompute dan Hologres. Mode ini direkomendasikan jika Anda adalah anggota proyek MaxCompute atau instans Hologres dan memiliki izin Select.

    • Default Access Identity Of The Data Source: Jika akun Anda saat ini berbeda dengan identitas akses default yang ditetapkan saat sumber data dibuat, berikan identitas ini ke akun Anda saat ini.

  2. Setelah menulis pernyataan SQL, Anda dapat mengklik Run All atau memilih bagian pernyataan tertentu dan mengklik Run Selected.

    Sebelum menjalankan pernyataan SQL MaxCompute, perkiraan biaya akan ditampilkan. Anda juga dapat mengklik More > Cost Estimate di bilah alat di atas file SQL untuk mendapatkan perkiraan tersebut.
  3. Setelah pernyataan SQL dieksekusi, Anda dapat melihat Run Log, Run Result, dan konten SQL yang sesuai di halaman hasil kueri.

    Anda dapat mengklik tombol di pojok kanan atas hasil kueri untuk mengganti tata letak halaman antara tata letak berdampingan dan tata letak atas-bawah.

Langkah 4: Visualisasikan hasil kueri

Di bilah alat di sebelah kiri hasil kueri, Anda dapat mengklik tombol untuk secara otomatis menghasilkan grafik visual dari hasil tersebut.

Catatan

Anda dapat mengklik tombol Copilot di atas grafik untuk mencoba fitur DataWorks Copilot Ask.

Langkah 5: Ekspor dan bagikan

Penting

Untuk mengekspor data ke file lokal lalu mengimpornya ke sumber data lain, Anda dapat menggunakan tugas sinkronisasi offline di Data Integration guna migrasi dan sinkronisasi data yang lebih efisien dan stabil.

Anda dapat mengekspor hasil kueri SQL dalam format berikut:

Saat Anda perlu mengunduh data dalam jumlah besar dari MaxCompute, kami merekomendasikan agar Anda mengklik ikon Settings di pojok kiri bawah menu SQL Query untuk mengubah mode eksekusi SQL menjadi Run And Generate Temporary Table
  • File lokal: Anda dapat mengunduh hasil kueri ke perangkat lokal dalam format CSV, TXT, atau XLS. Poin-poin penting dijelaskan di bawah ini:

    Item

    Deskripsi

    Batas unduh

    Penting

    Jika opsi ini tidak tersedia, lihat Mengapa hasil kueri atau opsi unduh saya dibatasi? untuk pemecahan masalah.

    Download Scope

    Anda dapat memilih untuk mengunduh Only Data Displayed In The Table atau All Data.

    • Data Displayed In The Table Only: Mengunduh hanya data pada halaman saat ini, hingga maksimum default 10000 catatan.

    • All Data: Mengekspor semua data hasil kueri dalam batas unduh.

    Metode unduh

    Mendukung Download With Approval dan Download Without Approval.

    • Download with approval: Anda dapat mengatur aturan Pendeteksian Penipuan untuk mendeteksi risiko dalam operasi pengunduhan data. Saat mengunduh data, Anda harus mengajukan permintaan persetujuan unduh untuk memastikan kepatuhan dan keamanan data.

      Catatan

      Hanya Edisi Enterprise Edition DataWorks yang mendukung pengaturan dan pengaktifan aturan Pendeteksian Penipuan.

    • Download without approval: Ini adalah metode default. Tidak diperlukan permintaan izin selama proses pengunduhan.

  • Object Storage Service (OSS): Anda dapat mengekspor hasil kueri dalam format tertentu, seperti CSV atau Parquet, ke ruang Object Storage Service (OSS) Alibaba Cloud. Ini cocok untuk pengarsipan volume data besar atau integrasi dengan produk cloud lainnya.

    Pertama kali menggunakan fitur ini, Anda harus memberikan izin kepada DataWorks untuk mengakses sumber daya OSS Anda. Di daftar tarik-turun File path, klik tautan one-click authorization dalam prompt dan ikuti petunjuk di layar untuk menyelesaikan otorisasi RAM.

    Item konfigurasi

    Deskripsi

    File path

    Klik ikon folder di sebelah kanan untuk memilih Bucket OSS dan folder tempat Anda ingin menyimpan file hasil.

    File name

    Sistem secara otomatis menghasilkan nama file. Anda juga dapat mengubahnya secara manual.

    Text type

    Pilih format file ekspor. Format yang didukung adalah csv, text, orc, dan parquet.

    Separator

    Menentukan pembatas antar kolom. Default-nya adalah koma (,).

    Encoding format

    Pilih format encoding untuk file, seperti UTF-8 atau GBK.

    CU

    Konfigurasikan jumlah unit komputasi (CU) untuk tugas ekspor ini. Nilai default-nya adalah 1 CU.

    Resource group

    Pilih kelompok sumber daya Serverless untuk menjalankan tugas ekspor ini. Jika Anda tidak memilih, kelompok sumber daya integrasi data yang ditetapkan di DataAnalysis > System Administration akan digunakan secara default.

    Setelah konfigurasi selesai, klik OK untuk memulai tugas ekspor. Anda dapat melihat progres ekspor, log jalankan, dan detail konfigurasi di halaman tugas yang sedang berjalan. Setelah tugas berhasil, buka konsol OSS untuk mengunduh file objek yang diekspor ke perangkat lokal Anda.

  • Tabel MaxCompute: Anda tidak perlu mengunduh data ke perangkat lokal lalu mengunggahnya ke tabel MaxCompute. Anda dapat mengatur siklus hidup tabel sesuai kebutuhan.

    Opsi ini hanya tersedia saat Anda mengkueri konten dari mesin MaxCompute.
  • Workbook: Anda dapat menyimpan hasil ke buku kerja untuk analisis data kueri lebih lanjut. Anda juga dapat membagikan hasil analisis terbaru dari buku kerja kepada orang lain.

  • DingTalk Sheet: Anda dapat mengekspor hasil ke DingTalk Sheet.

Operasi lainnya

Kelola versi file SQL

Di halaman pengeditan file SQL, Anda dapat mengklik More > Version di bilah alat atas untuk melihat perbedaan antara kode yang disimpan otomatis dan kode yang disimpan manual, serta memilih versi yang ingin Anda simpan.

Cari kode

Di atas pohon folder di sebelah kiri, klik image.png dan masukkan kata kunci untuk mencari kode. Fitur ini hanya tersedia di DataWorks Edisi Standar dan yang lebih tinggi.

Lihat riwayat jalankan

Di atas pohon folder di sebelah kiri, klik 历史 untuk melihat catatan eksekusi historis kueri SQL.

FAQ

Bagaimana cara memberikan izin identitas akses default untuk sumber data?

  1. Buka Pusat Keamanan.

    Masuk ke konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih Data Governance > Security Center. Di halaman yang muncul, klik Go to Security Center.

  2. Di panel navigasi kiri, klik Security Policy > Data Query And Analysis Control untuk membuka halaman kontrol izin DataAnalysis.

  3. Ganti ruang kerja, temukan sumber data tujuan, lalu klik tombol Authorize di sebelah kanan untuk memberikan izin.

    管控数据源

Mengapa eksekusi kueri SQL gagal?

Jika Anda menemui kesalahan This node can only run on exclusive resource groups selama eksekusi, buka DataAnalysis > More > System Administration dan konfigurasikan Schedule Resource Group serta Data Integration Resource Group untuk mesin yang sesuai.

Mengapa hasil kueri atau opsi unduh saya dibatasi?

Hanya sebagian hasil kueri SQL yang dapat ditampilkan. Ikuti langkah-langkah berikut untuk menyesuaikan batas tampilan ke maksimum. Anda juga dapat mengelola kemampuan unduh. Untuk informasi selengkapnya, lihat Kontrol kueri dan analisis data.

  1. Buka Pusat Keamanan.

    Masuk ke konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih Data Governance > Security Center. Di halaman yang muncul, klik Go to Security Center.

  2. Di panel navigasi kiri, klik Security Policy > Data Query And Analysis Control untuk membuka halaman kontrol izin DataAnalysis.

  3. Beralih ke tab Query Result Control dan sesuaikan Maximum records to display at a time, Maximum records to copy at a time, Maximum records to download at a time, serta Allow Download.

    image