全部产品
Search
文档中心

MaxCompute:Kembangkan UDF Python

更新时间:Jul 02, 2025

MaxCompute Studio memungkinkan Anda mengembangkan fungsi yang ditentukan pengguna (UDF) dalam Python. Topik ini menjelaskan cara mengembangkan, menguji, dan mempublikasikan UDF Python.

Prasyarat

Operasi berikut telah selesai:

Kembangkan UDF Python

  1. Di bagian Project, klik kanan scripts di bawah modul skrip MaxCompute dan pilih New > MaxCompute Python.
  2. Dalam kotak dialog Create new MaxCompute python class, masukkan nama kelas di bidang Name, pilih python UDF dari daftar drop-down Kind, lalu klik OK.
  3. Tulis kode UDF di editor kode.

Uji UDF Python

Setelah UDF dikembangkan, Anda harus menguji apakah kode UDF bekerja sesuai harapan. MaxCompute Studio mendukung pelaksanaan lokal sehingga Anda dapat menguji kode secara lokal. Anda dapat mengunduh data sampel tertentu dari tabel ke mesin lokal Anda, menjalankan kode pada data sampel tersebut, dan melakukan debugging.

  1. Klik kanan UDF Python yang telah dikembangkan dan pilih RUN.
  2. Dalam kotak dialog Edit configuration, konfigurasikan parameter dan klik OK.
    **
    • MaxCompute project: Proyek MaxCompute tempat UDF berjalan. Jika proyek MaxCompute yang Anda buat dengan melakukan operasi yang disediakan di Kelola koneksi proyek terhubung, nama proyek MaxCompute digunakan di bidang ini. Anda juga bisa menambahkan proyek lainnya sesuai petunjuk.
    • MaxCompute table: Nama tabel MaxCompute tempat UDF berjalan. Anda dapat memilih tabel dalam proyek MaxCompute dari daftar drop-down.
    • Table columns: Kolom dalam tabel MaxCompute tempat UDF berjalan.
    • Download Record limit: jumlah maksimum catatan yang dapat diunduh. Nilai default: 100.
    Catatan
    • Jika data yang ditentukan sudah diunduh, MaxCompute Studio tidak akan mengunduh data lagi. Untuk mengunduh data lagi, jalankan perintah Tunnel pada klien MaxCompute.
    • Secara default, 100 rekaman diunduh. Untuk mengunduh lebih banyak data sampel, jalankan perintah Tunnel pada klien MaxCompute atau gunakan fitur unduh tabel MaxCompute Studio.
    • Setelah data sampel diunduh, Anda dapat melihat data di file data tabel di bawah direktori warehouse.
  3. MaxCompute Studio mengambil data sampel dari file data berdasarkan kolom yang Anda tentukan dan memanggil UDF untuk menjalankannya secara lokal pada data sampel tersebut.
    Catatan Pelaksanaan lokal dilakukan menggunakan skrip pyou yang disediakan oleh MaxCompute SDK untuk Python (PyODPS). Perintah untuk memulai pelaksanaan lokal adalah pyou hello.Plus<data. Setelah Anda menginstal PyODPS, Anda dapat menjalankan perintah terkait untuk memeriksa apakah skrip pyou ada:
    • Untuk Windows, jalankan perintah ${python}/../Scripts/pyou.
    • Untuk macOS, jalankan perintah ${python}/../pyou.
  4. Lihat output di tab Console, periksa apakah UDF bekerja sesuai harapan, dan debug kode jika diperlukan.

Publikasikan UDF Python

Setelah UDF Python diuji, Anda dapat mempublikasikannya ke lingkungan produksi. Untuk informasi lebih lanjut, lihat Unggah program Python dan buat UDF MaxCompute.