All Products
Search
Document Center

MaxCompute:Kembangkan Python UDF

Last Updated:Jun 21, 2026

Anda dapat menggunakan MaxCompute Studio untuk mengembangkan fungsi user-defined (UDF) Python. Topik ini menjelaskan cara mengembangkan, menguji, dan mempublikasikannya.

Prasyarat

Sebelum memulai, lengkapi langkah-langkah berikut:

Kembangkan Python UDF

  1. Di panel Project, di bawah direktori MaxCompute Studio, klik kanan scripts lalu pilih New > MaxCompute Python.
  2. Di kotak dialog Create new MaxCompute python class, masukkan nama kelas di bidang Name, atur Kind menjadi Python UDF, lalu klik OK.
  3. Tulis kode UDF di editor.
    from odps.udf import annotate
    @annotate("bigint,bigint->bigint")
    class Hello(object):
        def evaluate(self, arg0, arg1):
            if None in (arg0,arg1):
                return None
            return arg0+arg1

Uji UDF

Setelah mengembangkan UDF, Anda harus mengujinya untuk memastikan berfungsi sesuai harapan. MaxCompute Studio mendukung pengujian lokal, yang memungkinkan Anda mengunduh data sampel dari tabel untuk menjalankan dan men-debug UDF secara lokal.

  1. Klik kanan skrip Python UDF lalu pilih RUN.
  2. Di halaman Edit configuration, konfigurasikan parameter yang diperlukan lalu klik OK.
    • MaxCompute project: Proyek MaxCompute tempat UDF dijalankan. Jika Anda telah mengonfigurasi koneksi proyek MaxCompute di Kelola koneksi proyek, bidang ini secara default menggunakan proyek yang terhubung. Anda juga dapat menambahkan proyek lain sesuai petunjuk.
    • MaxCompute table: Tabel sumber MaxCompute untuk eksekusi UDF. Anda dapat memilih tabel dari daftar drop-down tabel dalam proyek MaxCompute yang dipilih.
    • Table columns: Kolom tabel sumber yang digunakan oleh UDF.
    • Download Record limit: Jumlah maksimum catatan yang akan diunduh. Default: 100.
    Catatan
    • Jika data telah diunduh sebelumnya, MaxCompute Studio tidak mengunduhnya lagi. Untuk mengunduh ulang data, jalankan perintah Tunnel di client MaxCompute.
    • Secara default, 100 catatan diunduh. Untuk menguji dengan lebih banyak data, unduh data menggunakan perintah Tunnel di client MaxCompute atau fitur unduh tabel di MaxCompute Studio.
    • Setelah pengunduhan selesai, Anda dapat menemukan data sampel di file data milik tabel, yang berada di direktori warehouse.
  3. Framework eksekusi lokal mengambil data dari kolom yang ditentukan dalam file data dan menjalankan UDF secara lokal.
    Catatan Eksekusi lokal menggunakan skrip pyou dari PyODPS. Perintahnya adalah pyou hello.Hello<data. Setelah menginstal PyODPS, Anda dapat menjalankan perintah tersebut untuk memverifikasi keberadaan skrip.
    • Jika Anda menggunakan Windows, jalankan perintah ${python}/../Scripts/pyou.
    • Jika Anda menggunakan macOS, jalankan perintah ${python}/../pyou.
  4. Contoh berikut menunjukkan kode sumber Python UDF. Setelah menjalankan kode tersebut, Anda dapat melihat output-nya di Konsol.
    from odps.udf import annotate
    @annotate("bigint,bigint->bigint")
    class Plus(object):
        def evaluate(self, arg0, arg1):
            if None in (arg0, arg1):
                return None
            return arg0 + arg1

Publikasikan Python UDF

Setelah Python UDF lolos pengujian, Anda dapat mempublikasikannya ke lingkungan produksi. Untuk informasi selengkapnya, lihat Unggah dan daftarkan fungsi.