Melalui eksperimen dalam topik ini, Anda akan menjelajahi kemampuan DataWorks Copilot sebagai asisten pemrograman cerdas. Ini mencakup pembuatan kode, penulisan ulang kode, interpretasi kode, penyelesaian kode, koreksi kesalahan satu klik, serta interpretasi sintaksis dan fungsi. Anda juga akan mengeksplorasi berbagai kemampuan agen pintar seperti pembuatan tabel dengan bantuan AI, pembuatan bagan cerdas, dan pembuatan deskripsi untuk penyebaran node dan fungsi.
Informasi latar belakang
Ikhtisar DataWorks
DataWorks adalah platform pengembangan dan tata kelola data berbasis lakehouse yang cerdas. Platform ini memanfaatkan metodologi pengembangan big data dari Alibaba Group yang telah teruji selama 15 tahun. DataWorks kompatibel mendalam dengan puluhan layanan komputasi big data dan AI dari Alibaba Cloud, termasuk MaxCompute, E-MapReduce (EMR), Hologres, Realtime Compute for Apache Flink, dan Platform for AI (PAI). DataWorks mendukung pengembangan ETL cerdas, analisis data, serta tata kelola aset data proaktif untuk gudang data, danau data, dan arsitektur lakehouse OpenLake, sehingga memfasilitasi manajemen data di seluruh siklus hidup Data+AI. Sejak 2009, DataWorks telah menyempurnakan sistem data Alibaba untuk melayani berbagai industri seperti sektor layanan publik, keuangan, ritel, Internet, otomotif, dan manufaktur. DataWorks telah memperoleh kepercayaan dari puluhan ribu pelanggan yang menggunakannya untuk transformasi digital dan penciptaan nilai.
DataWorks Copilot adalah asisten cerdas Anda. Anda dapat memilih untuk menggunakan model DataWorks default, Qwen3-235B-A22B, DeepSeek-R1-0528, atau Qwen3-Coder untuk melakukan operasi Copilot. Dengan kekuatan penalaran tingkat lanjut dari DeepSeek-R1, DataWorks Copilot memungkinkan Anda melakukan tugas-tugas kompleks, seperti pembuatan, optimasi, dan pengujian kode SQL, berdasarkan interaksi bahasa alami. Ini sangat meningkatkan efisiensi pengembangan ETL dan analisis data.
Tindakan pencegahan
Wilayah dan edisi DataWorks tempat pratinjau publik DataWorks Copilot tersedia terbatas. Untuk informasi lebih lanjut, lihat bagian Deskripsi Pratinjau Publik dalam topik "DataWorks Copilot".
DataWorks Copilot mendukung SQL dan Python. SQL digunakan dalam eksperimen.
Fitur DataWorks Copilot tidak bervariasi berdasarkan jenis mesin komputasi. DataWorks Copilot mendukung semua node bertipe kode. Dalam eksperimen, node MaxCompute digunakan.
Persiapan lingkungan
DataWorks diaktifkan. Untuk informasi lebih lanjut, lihat Aktivasi DataWorks.
Ruang kerja DataWorks dibuat. Untuk informasi lebih lanjut, lihat Buat Ruang Kerja.
Akun Anda memenuhi persyaratan pratinjau publik DataWorks Copilot dan telah bergabung dalam pratinjau publik. Untuk informasi lebih lanjut, lihat DataWorks Copilot.
Prosedur eksperimen
Eksperimen dalam bagian berikutnya tidak dalam urutan tertentu. Anda dapat mencobanya sesuai pilihan Anda.
NL2Code
DataWorks Copilot menghasilkan kode SQL berdasarkan bahasa alami.
Di panel DATA STUDIO, klik ikon
di sebelah kanan Direktori Ruang Kerja dan pilih Buat Node > MaxCompute > MaxCompute SQL.
Di pop-up yang muncul, masukkan nama node dan tekan tombol Enter.
Nama node preset:
ads_ec_ec360_gmv_kpi_overview
Di editor kode, klik
untuk meminta DataWorks Copilot melakukan sesuatudan buka antarmuka Copilot Chat. Di antarmuka tersebut, masukkan perintah, klik Kirim, dan tunggu Copilot mengembalikan hasilnya.Instruksi preset:
Kumpulkan statistik tentang informasi berikut untuk setiap Unit Produk Standar (SPU) berdasarkan tabel dwd_ec_trd_create_ord_di dalam periode waktu dari 1 hingga 18 September 2024: pendapatan penjualan, volume penjualan, jumlah Unit Penyimpanan Stok (SKU), jumlah pembeli, dan jumlah penjual..


Penyelesaian kode cerdas
DataWorks Copilot dapat menyelesaikan kode Anda.
Di panel DATA STUDIO, buat node MaxCompute. Di editor kode, klik Copilot untuk membuka antarmuka Copilot Chat. Masukkan potongan kode apa pun yang berisi nama tabel, tekan Spasi atau Enter, dan tunggu Copilot mengembalikan hasilnya.

Tanya Jawab Cerdas
Di DataWorks Copilot, Anda dapat melakukan operasi berikut menggunakan bahasa alami, seperti memperbaiki kesalahan kode, menghasilkan komentar kode, dan menginterpretasi kode. DataWorks Copilot juga dapat menjawab pertanyaan tentang sintaksis dan fungsi SQL.
Penulisan ulang SQL
Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, masukkan dan pilih potongan kode, lalu klik Copilot di pojok kanan atas halaman Data Studio. Di jendela obrolan DataWorks Copilot, masukkan permintaan penulisan ulang Anda dan klik Kirim. Lalu tunggu DataWorks Copilot mengembalikan hasilnya.
Instruksi preset:
Ubah pernyataan SQL untuk mentransformasi hasil kueri dari kolom ke baris menggunakan operasi UNPIVOT.

Koreksi kesalahan SQL
Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih dan klik kanan potongan kode dan pilih Copilot > SQL Rectify. Di pop-up obrolan DataWorks Copilot, klik Kirim, dan tunggu DataWorks Copilot mengembalikan hasilnya.

Interpretasi SQL
Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih potongan kode, dan klik Copilot di pojok kanan atas halaman Data Studio. Di jendela obrolan DataWorks Copilot, masukkan instruksi Anda, dan klik Kirim. Lalu tunggu DataWorks Copilot mengembalikan hasilnya.
Instruksi preset:
Interpretasikan pernyataan SQL.

Pembuatan komentar
Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih dan klik kanan potongan kode dan pilih Copilot > SQL Comments. Di pop-up obrolan DataWorks Copilot, masukkan instruksi Anda, klik Kirim, lalu tunggu DataWorks Copilot mengembalikan hasilnya.
Instruksi preset:
Tambahkan komentar untuk setiap bidang.

Tanya Jawab tentang sintaksis dan fungsi SQL
Di panel DATA STUDIO, klik Copilot di pojok kanan atas halaman Data Studio. Di jendela obrolan DataWorks Copilot, masukkan instruksi Anda dan klik Kirim. Lalu tunggu DataWorks Copilot mengembalikan hasilnya.
Instruksi preset 1:
Bagaimana cara menggunakan sintaks Common Table Expression (CTE) di MaxCompute?Instruksi preset 2:
Bagaimana cara menggunakan MapJoin di MaxCompute?Instruksi preset 3:
Bagaimana cara menggunakan fungsi PIVOT MaxCompute?Instruksi preset 4:
Sebuah tabel berisi bidang ID auto-increment yang nilainya tidak kontinu. Bagaimana cara mendapatkan rentang ID per halaman di tabel tersebut?Instruksi preset 5:
Saya memiliki tabel bernama t1(name) dan t2(name). Tulis pernyataan SQL untuk mencapai tujuan berikut: Jika tidak ada hasil kueri yang dikembalikan untuk t1.name, gunakan hasil kueri t2.name.

AI Agent
Layanan DataWorks, seperti Data Studio, DataAnalysis, Data Map, dan DataService Studio, memungkinkan Anda menggunakan DataWorks Copilot untuk dengan mudah melakukan operasi tertentu, membuat layanan lebih mudah digunakan. Misalnya, Anda dapat menggunakan asisten pembuatan tabel DataWorks Copilot untuk membuat tabel dengan memasukkan kata kunci nama tabel. Anda juga dapat menggunakan asisten analisis DataWorks Copilot untuk melihat bagan tentang hasil kueri data dan mendapatkan wawasan data hanya dengan beberapa klik.
Pembuatan tabel cerdas
Di panel navigasi kiri halaman Data Studio, klik Data Catalog. Di panel DATA CATALOG, pilih katalog data dan buat tabel di katalog tersebut. Di bilah alat atas halaman yang muncul, klik Gunakan Copilot untuk Membuat Tabel. Masukkan instruksi Anda di bidang yang ditampilkan, klik Kirim, lalu tunggu DataWorks Copilot mengembalikan hasilnya.
Instruksi preset: Tabel informasi pendaftaran anggota

Pembuatan bagan data dan wawasan data
Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih potongan kode yang dapat dieksekusi dan klik Jalankan di bilah alat atas. Setelah pernyataan SQL berhasil dijalankan dan hasil kueri dihasilkan, klik ikon bagan di tab RESULT, yang muncul di bagian bawah halaman. Di area yang muncul di sebelah kanan, klik Copilot dan tunggu DataWorks Copilot mengembalikan hasilnya.

Pembuatan deskripsi
Pembuatan deskripsi untuk penyebaran node
Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih potongan kode yang dapat dieksekusi dan klik Properti di panel navigasi sisi kanan. Di tab yang muncul, konfigurasikan parameter dan klik Sebarkan di bilah alat atas. Di tab DEPLOY, yang muncul di bagian bawah halaman, klik ikon DataWorks Copilot di pojok kanan bawah kotak input di Langkah 3: Sebarkan ke Lingkungan Produksi dan tunggu DataWorks Copilot mengembalikan hasilnya.
Nama node preset: ads_ec_ec360_gmv_kpi_overview

Pembuatan deskripsi untuk fungsi
Di panel navigasi kiri halaman Data Studio, klik Resource Management. Di panel RESOURCE MANAGEMENT, temukan fungsi MaxCompute yang ada, atau buat satu. Di tab konfigurasi fungsi MaxCompute, klik ikon DataWorks Copilot di pojok kanan bawah bidang Deskripsi dan tunggu DataWorks Copilot mengembalikan hasilnya.
Nama fungsi preset: udfjaccardsimilarity
