全部产品
Search
文档中心

MaxCompute:DataFrame (tidak direkomendasikan)

更新时间:Jul 02, 2025

PyODPS menyediakan API mirip pandas, PyODPS DataFrame, yang memanfaatkan sepenuhnya kemampuan komputasi MaxCompute. Anda juga dapat mengonversi sumber data dari tabel MaxCompute ke pandas DataFrame sehingga kode yang sama dapat dijalankan pada pandas.

Catatan

Pemeliharaan PyODPS DataFrame telah dihentikan. Untuk proyek baru, jangan gunakan fitur ini.

  • Memulai: menjelaskan cara membuat dan mengelola objek DataFrame serta menggunakan DataFrame untuk memproses data.

  • Membuat Objek DataFrame: menjelaskan cara membuat proyek DataFrame untuk mereferensikan sumber data.

  • Urutan: memperkenalkan objek urutan dalam DataFrame. SequenceExpr mewakili kolom dalam kumpulan data dua dimensi. Anda tidak diperbolehkan membuat objek SequenceExpr secara manual; objek tersebut hanya dapat diambil dari objek koleksi.

  • Koleksi: memperkenalkan objek koleksi dalam DataFrame. CollectionExpr mendukung berbagai operasi pada kumpulan data dua dimensi, seperti operasi kolom, penyaringan data, dan transformasi data.

  • Eksekusi: memperkenalkan metode eksekusi yang dapat dipanggil untuk melakukan operasi dalam DataFrame.

  • API MapReduce: menjelaskan cara menggunakan API MapReduce dalam DataFrame.

  • Operasi Kolom: menjelaskan operasi kolom yang didukung oleh DataFrame.

  • Agregasi: menjelaskan operasi agregasi yang didukung oleh DataFrame, termasuk implementasi agregasi grup dan penulisan fungsi agregat.

  • Pengurutan, Penghapusan Duplikat, Pengambilan Sampel, dan Transformasi Data: menjelaskan cara melakukan pengurutan, penghapusan duplikat, pengambilan sampel, dan transformasi data pada objek DataFrame.

  • Menggabungkan Data: menjelaskan operasi penggabungan data yang didukung oleh DataFrame, termasuk operasi JOIN dan UNION.

  • Fungsi Jendela: menjelaskan fungsi jendela yang didukung oleh DataFrame.

  • Plotting: menjelaskan metode plotting yang disediakan oleh DataFrame.

  • Debugging: menjelaskan cara melakukan debugging DataFrame. DataFrame dapat mengoptimalkan dan menampilkan seluruh proses eksekusi, yang dapat divisualisasikan.