全部产品
Search
文档中心

:Asisten pengkodean cerdas

更新时间:Oct 28, 2025

Melalui eksperimen dalam topik ini, Anda akan menjelajahi kemampuan DataWorks Copilot sebagai asisten pemrograman cerdas. Ini mencakup pembuatan kode, penulisan ulang kode, interpretasi kode, penyelesaian kode, koreksi kesalahan satu klik, serta interpretasi sintaksis dan fungsi. Anda juga akan mengeksplorasi berbagai kemampuan agen pintar seperti pembuatan tabel dengan bantuan AI, pembuatan bagan cerdas, dan pembuatan deskripsi untuk penyebaran node dan fungsi.

Informasi latar belakang

Ikhtisar DataWorks

DataWorks adalah platform pengembangan dan tata kelola data berbasis lakehouse yang cerdas. Platform ini memanfaatkan metodologi pengembangan big data dari Alibaba Group yang telah teruji selama 15 tahun. DataWorks kompatibel mendalam dengan puluhan layanan komputasi big data dan AI dari Alibaba Cloud, termasuk MaxCompute, E-MapReduce (EMR), Hologres, Realtime Compute for Apache Flink, dan Platform for AI (PAI). DataWorks mendukung pengembangan ETL cerdas, analisis data, serta tata kelola aset data proaktif untuk gudang data, danau data, dan arsitektur lakehouse OpenLake, sehingga memfasilitasi manajemen data di seluruh siklus hidup Data+AI. Sejak 2009, DataWorks telah menyempurnakan sistem data Alibaba untuk melayani berbagai industri seperti sektor layanan publik, keuangan, ritel, Internet, otomotif, dan manufaktur. DataWorks telah memperoleh kepercayaan dari puluhan ribu pelanggan yang menggunakannya untuk transformasi digital dan penciptaan nilai.

DataWorks Copilot adalah asisten cerdas Anda. Anda dapat memilih untuk menggunakan model DataWorks default, Qwen3-235B-A22B, DeepSeek-R1-0528, atau Qwen3-Coder untuk melakukan operasi Copilot. Dengan kekuatan penalaran tingkat lanjut dari DeepSeek-R1, DataWorks Copilot memungkinkan Anda melakukan tugas-tugas kompleks, seperti pembuatan, optimasi, dan pengujian kode SQL, berdasarkan interaksi bahasa alami. Ini sangat meningkatkan efisiensi pengembangan ETL dan analisis data.

Tindakan pencegahan

  • Wilayah dan edisi DataWorks tempat pratinjau publik DataWorks Copilot tersedia terbatas. Untuk informasi lebih lanjut, lihat bagian Deskripsi Pratinjau Publik dalam topik "DataWorks Copilot".

  • DataWorks Copilot mendukung SQL dan Python. SQL digunakan dalam eksperimen.

  • Fitur DataWorks Copilot tidak bervariasi berdasarkan jenis mesin komputasi. DataWorks Copilot mendukung semua node bertipe kode. Dalam eksperimen, node MaxCompute digunakan.

Persiapan lingkungan

  • DataWorks diaktifkan. Untuk informasi lebih lanjut, lihat Aktivasi DataWorks.

  • Ruang kerja DataWorks dibuat. Untuk informasi lebih lanjut, lihat Buat Ruang Kerja.

  • Akun Anda memenuhi persyaratan pratinjau publik DataWorks Copilot dan telah bergabung dalam pratinjau publik. Untuk informasi lebih lanjut, lihat DataWorks Copilot.

Prosedur eksperimen

Catatan

Eksperimen dalam bagian berikutnya tidak dalam urutan tertentu. Anda dapat mencobanya sesuai pilihan Anda.

NL2Code

DataWorks Copilot menghasilkan kode SQL berdasarkan bahasa alami.

  1. Di panel DATA STUDIO, klik ikon image di sebelah kanan Direktori Ruang Kerja dan pilih Buat Node > MaxCompute > MaxCompute SQL.

    image

  2. Di pop-up yang muncul, masukkan nama node dan tekan tombol Enter.

    Nama node preset: ads_ec_ec360_gmv_kpi_overview

    image

  3. Di editor kode, klik untuk meminta DataWorks Copilot melakukan sesuatu dan buka antarmuka Copilot Chat. Di antarmuka tersebut, masukkan perintah, klik Kirim, dan tunggu Copilot mengembalikan hasilnya.

    Instruksi preset: Kumpulkan statistik tentang informasi berikut untuk setiap Unit Produk Standar (SPU) berdasarkan tabel dwd_ec_trd_create_ord_di dalam periode waktu dari 1 hingga 18 September 2024: pendapatan penjualan, volume penjualan, jumlah Unit Penyimpanan Stok (SKU), jumlah pembeli, dan jumlah penjual..

image

image

Penyelesaian kode cerdas

DataWorks Copilot dapat menyelesaikan kode Anda.

Di panel DATA STUDIO, buat node MaxCompute. Di editor kode, klik Copilot untuk membuka antarmuka Copilot Chat. Masukkan potongan kode apa pun yang berisi nama tabel, tekan Spasi atau Enter, dan tunggu Copilot mengembalikan hasilnya.

Kode Preset:

-- Lakukan analisis pesanan penjualan situs e-commerce pada bulan September 2024.
SELECT  ds
        ,spu_id
        ,SUM(sales_amt) AS total_sales
        ,COUNT(DISTINCT order_id) AS total_orders
        ,COUNT(DISTINCT sku_id) AS total_skus
        ,COUNT(DISTINCT buyer_id) AS total_buyers
FROM    default.dwd_ec_trd_create_ord_di
WHERE   order_date BETWEEN '2024-09-01' AND '2024-09-18'
;

image

Tanya Jawab Cerdas

Di DataWorks Copilot, Anda dapat melakukan operasi berikut menggunakan bahasa alami, seperti memperbaiki kesalahan kode, menghasilkan komentar kode, dan menginterpretasi kode. DataWorks Copilot juga dapat menjawab pertanyaan tentang sintaksis dan fungsi SQL.

Penulisan ulang SQL

Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, masukkan dan pilih potongan kode, lalu klik Copilot di pojok kanan atas halaman Data Studio. Di jendela obrolan DataWorks Copilot, masukkan permintaan penulisan ulang Anda dan klik Kirim. Lalu tunggu DataWorks Copilot mengembalikan hasilnya.

  • Instruksi preset: Ubah pernyataan SQL untuk mentransformasi hasil kueri dari kolom ke baris menggunakan operasi UNPIVOT.

  • Kode Preset:

    -- Lakukan analisis pesanan penjualan situs e-commerce pada bulan September 2024.
    SELECT  ds
            ,spu_id
            ,SUM(sales_amt) AS total_sales
            ,COUNT(DISTINCT order_id) AS total_orders
            ,COUNT(DISTINCT sku_id) AS total_skus
            ,COUNT(DISTINCT buyer_id) AS total_buyers
            ,COUNT(DISTINCT buyer_id) / COUNT(DISTINCT order_id) AS avg_buyers_per_order
            ,COUNT(DISTINCT buyer_id) / COUNT(DISTINCT sku_id) AS avg_buyers_per_sku
            ,SUM(sales_amt) / COUNT(DISTINCT order_id) AS avg_sales_per_order
            ,SUM(sales_amt) / COUNT(DISTINCT sku_id) AS avg_sales_per_sku
    FROM    default.dwd_ec_trd_create_ord_di
    WHERE   order_date BETWEEN '2024-09-01' AND '2024-09-18'
    GROUP BY ds
    ,spu_id
    ORDER BY total_sales DESC
    LIMIT   10
    ;

image

Koreksi kesalahan SQL

Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih dan klik kanan potongan kode dan pilih Copilot > SQL Rectify. Di pop-up obrolan DataWorks Copilot, klik Kirim, dan tunggu DataWorks Copilot mengembalikan hasilnya.

Kode Preset:

-- Lakukan analisis pesanan penjualan situs e-commerce pada bulan September 2024.
SELECT  ds
        ,spu_id
        ,SUM(sales_amt) AS total_sales
        ,COUNT(DISTINCT order_id) AS total_orders
        ,COUNT(DISTINCT sku_id) AS total_skus
        COUNT(DISTINCT buyer_id) AS total_buyers
        COUNT(DISTINCT buyer_id) / COUNT(DISTINCT order_id) AS avg_buyers_per_order
        ,COUNT(DISTINCT buyer_id) / COUNT(DISTINCT sku_id)  AS avg_buyers_per_sku
        ,SUM(sales_amt) / COUNT(DISTINCT order_id) AS avg_sales_per_order
        ,SUM(sales_amt) / COUNT(DISTINCT sku_id) AS avg_sales_per_sku
FROM    default.dwd_ec_trd_create_ord_di
WHERE   order_date BETWEEN '2024-09-01' AND '2024-09-18'
ORDER BY total_sales DESC
LIMIT   10
;

image

Interpretasi SQL

Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih potongan kode, dan klik Copilot di pojok kanan atas halaman Data Studio. Di jendela obrolan DataWorks Copilot, masukkan instruksi Anda, dan klik Kirim. Lalu tunggu DataWorks Copilot mengembalikan hasilnya.

  • Instruksi preset: Interpretasikan pernyataan SQL.

  • Kode Preset:

    SELECT  season
            ,SUM(tran_amt) AS total
    FROM    mf_cop_sales
    PIVOT (SUM(tran_amt) FOR season IN ('Q1' AS spring,'Q2' AS summer,'Q3' AS autumn,'Q4' AS winter))AS pivot_tablel
    ;

image

Pembuatan komentar

Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih dan klik kanan potongan kode dan pilih Copilot > SQL Comments. Di pop-up obrolan DataWorks Copilot, masukkan instruksi Anda, klik Kirim, lalu tunggu DataWorks Copilot mengembalikan hasilnya.

  • Instruksi preset: Tambahkan komentar untuk setiap bidang.

  • Kode Preset:

    CREATE TABLE ods_mbr_user_info
    (
      id                BIGINT
      ,gmt_create       STRING
      ,gmt_modified     STRING
      ,id_card_number   STRING
      ,id_card_type     STRING
      ,is_delete        STRING
      ,nick             STRING
      ,reg_address      STRING
      ,reg_birthdate    STRING
      ,reg_city_id      STRING
      ,reg_email        STRING
      ,reg_fullname     STRING
      ,reg_gender       STRING
      ,reg_mobile_phone STRING
      ,reg_nation_id    STRING
      ,reg_prov_id      STRING
      ,user_active_time STRING
      ,user_active_type STRING
      ,user_id          BIGINT
      ,user_regdate     STRING
      ,user_regip       STRING
      ,vip_level        STRING
    )
    COMMENT '';

image

Tanya Jawab tentang sintaksis dan fungsi SQL

Di panel DATA STUDIO, klik Copilot di pojok kanan atas halaman Data Studio. Di jendela obrolan DataWorks Copilot, masukkan instruksi Anda dan klik Kirim. Lalu tunggu DataWorks Copilot mengembalikan hasilnya.

  • Instruksi preset 1: Bagaimana cara menggunakan sintaks Common Table Expression (CTE) di MaxCompute?

  • Instruksi preset 2: Bagaimana cara menggunakan MapJoin di MaxCompute?

  • Instruksi preset 3: Bagaimana cara menggunakan fungsi PIVOT MaxCompute?

  • Instruksi preset 4: Sebuah tabel berisi bidang ID auto-increment yang nilainya tidak kontinu. Bagaimana cara mendapatkan rentang ID per halaman di tabel tersebut?

  • Instruksi preset 5: Saya memiliki tabel bernama t1(name) dan t2(name). Tulis pernyataan SQL untuk mencapai tujuan berikut: Jika tidak ada hasil kueri yang dikembalikan untuk t1.name, gunakan hasil kueri t2.name.

image

AI Agent

Layanan DataWorks, seperti Data Studio, DataAnalysis, Data Map, dan DataService Studio, memungkinkan Anda menggunakan DataWorks Copilot untuk dengan mudah melakukan operasi tertentu, membuat layanan lebih mudah digunakan. Misalnya, Anda dapat menggunakan asisten pembuatan tabel DataWorks Copilot untuk membuat tabel dengan memasukkan kata kunci nama tabel. Anda juga dapat menggunakan asisten analisis DataWorks Copilot untuk melihat bagan tentang hasil kueri data dan mendapatkan wawasan data hanya dengan beberapa klik.

Pembuatan tabel cerdas

Di panel navigasi kiri halaman Data Studio, klik Data Catalog. Di panel DATA CATALOG, pilih katalog data dan buat tabel di katalog tersebut. Di bilah alat atas halaman yang muncul, klik Gunakan Copilot untuk Membuat Tabel. Masukkan instruksi Anda di bidang yang ditampilkan, klik Kirim, lalu tunggu DataWorks Copilot mengembalikan hasilnya.

Instruksi preset: Tabel informasi pendaftaran anggota

image

Pembuatan bagan data dan wawasan data

Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih potongan kode yang dapat dieksekusi dan klik Jalankan di bilah alat atas. Setelah pernyataan SQL berhasil dijalankan dan hasil kueri dihasilkan, klik ikon bagan di tab RESULT, yang muncul di bagian bawah halaman. Di area yang muncul di sebelah kanan, klik Copilot dan tunggu DataWorks Copilot mengembalikan hasilnya.

Kode Preset:

-- Baca data sampel.
-- Buka model tiga lapis MaxCompute.
SET odps.namespace.schema = true
;

-- Pastikan implementasi baru untuk data tipe DECIMAL digunakan.
SET odps.sql.decimal.odps2 = true
;

SELECT  gross_regional_product -- Produk Regional Bruto (GRP) (CNY 100 juta).
        ,value_added_of_the_primary_industry -- Nilai tambah industri primer (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri primer di suatu negara (atau wilayah) selama periode waktu tertentu. Industri primer mencakup pertanian, kehutanan, peternakan, dan perikanan. 
        ,value_added_of_the_secondary_industry -- Nilai tambah industri sekunder (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri sekunder di suatu negara (atau wilayah) selama periode waktu tertentu. Industri sekunder mencakup pertambangan, manufaktur, sektor produksi dan pasokan listrik, gas, dan air, serta konstruksi. 
        ,value_added_of_the_tertiary_industry -- Nilai tambah industri tersier (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri tersier di suatu negara (atau wilayah) selama periode waktu tertentu. Industri tersier mencakup semua sektor kecuali industri primer dan sekunder. 
        ,value_added_of_agriculture_forestry_animal_husbandry_and_fishery -- Nilai tambah pertanian, kehutanan, peternakan, dan perikanan (CNY 100 juta).
        ,value_added_of_industry -- Nilai tambah industri (CNY 100 juta). Ini mengacu pada output akhir dari perusahaan industri dari aktivitas produksi industri selama periode pelaporan, dinyatakan dalam nilai moneter. 
        ,value_added_of_construction -- Nilai tambah industri konstruksi (CNY 100 juta). Ini mengacu pada output akhir dari perusahaan konstruksi dari aktivitas produksi industri konstruksi selama periode pelaporan, dinyatakan dalam nilai moneter. 
        ,value_added_of_wholesale_and_retail_trades -- Nilai tambah industri grosir dan eceran (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri grosir dan eceran di suatu negara (atau wilayah) selama periode waktu tertentu. 
        ,value_added_of_transport_storage_and_post -- Nilai tambah industri transportasi, penyimpanan, dan pos (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri transportasi, penyimpanan, dan pos di suatu negara (atau wilayah) selama periode waktu tertentu. 
        ,value_added_of_hotels_and_catering_services -- Nilai tambah industri akomodasi dan jasa boga (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri akomodasi dan jasa boga di suatu negara (atau wilayah) selama periode waktu tertentu. 
        ,value_added_of_financial_intermediation -- Nilai tambah industri keuangan (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri keuangan di suatu negara (atau wilayah) selama periode waktu tertentu. 
        ,value_added_of_real_estate -- Nilai tambah industri real estat (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri real estat di suatu negara (atau wilayah) selama periode waktu tertentu. 
        ,value_added_of_others -- Nilai tambah industri lainnya (CNY 100 juta). Ini mengacu pada nilai pasar output akhir dari semua unit penduduk dari aktivitas produksi industri lainnya di suatu negara (atau wilayah) selama periode waktu tertentu. 
        ,per_capital_gross_regional_product -- GRP per kapita (yuan/orang). GRP per kapita mengacu pada rasio nilai absolut GRP terhadap populasi rata-rata tahun itu. Ini mengukur kontribusi ekonomi atau nilai yang diciptakan oleh setiap penduduk di suatu negara atau wilayah. 
        ,region -- wilayah. Enumerasi mencakup 31 provinsi, kotamadya, dan daerah otonom di daratan Tiongkok, seperti Beijing, Provinsi Zhejiang, dan Daerah Otonom Mongolia Dalam. 
        ,year -- tahun. Enumerasi mencakup tahun-tahun dari 2003 hingga 2022.
FROM    bigdata_public_dataset.life_service.mainland_gross_regional_product
WHERE   year IS NOT NULL
LIMIT   100
;

image

Pembuatan deskripsi

Pembuatan deskripsi untuk penyebaran node

Di panel DATA STUDIO, buat node MaxCompute. Di editor kode node MaxCompute, pilih potongan kode yang dapat dieksekusi dan klik Properti di panel navigasi sisi kanan. Di tab yang muncul, konfigurasikan parameter dan klik Sebarkan di bilah alat atas. Di tab DEPLOY, yang muncul di bagian bawah halaman, klik ikon DataWorks Copilot di pojok kanan bawah kotak input di Langkah 3: Sebarkan ke Lingkungan Produksi dan tunggu DataWorks Copilot mengembalikan hasilnya.

Nama node preset: ads_ec_ec360_gmv_kpi_overview

image

Pembuatan deskripsi untuk fungsi

Di panel navigasi kiri halaman Data Studio, klik Resource Management. Di panel RESOURCE MANAGEMENT, temukan fungsi MaxCompute yang ada, atau buat satu. Di tab konfigurasi fungsi MaxCompute, klik ikon DataWorks Copilot di pojok kanan bawah bidang Deskripsi dan tunggu DataWorks Copilot mengembalikan hasilnya.

Nama fungsi preset: udfjaccardsimilarity

image