全部产品
Search
文档中心

Platform For AI:Cara menggunakan PyODPS untuk membaca dan menulis data di tabel MaxCompute

更新时间:Jan 18, 2026

Pada instans Data Science Workshop (DSW), Anda dapat menggunakan PyODPS untuk membaca data dari MaxCompute.

Persiapan

Sebelum memulai, lengkapi persiapan berikut:

  • MaxCompute telah diaktifkan. Untuk informasi selengkapnya, lihat Aktifkan MaxCompute.

  • Akun Anda memiliki izin yang diperlukan untuk mengoperasikan proyek MaxCompute. Jika Anda menggunakan akun root untuk login ke instans DSW, tidak diperlukan otorisasi tambahan. Jika Anda menggunakan pengguna Resource Access Management (RAM), berikan izin kepada pengguna RAM tersebut sebagai berikut.

    Prosedur

    1. Login ke Konsol MaxCompute menggunakan akun root Anda. Di pojok kiri atas, pilih wilayah.

    2. Pada panel navigasi, pilih Workspace > Project Management.

    3. Pada halaman Project Management, temukan proyek target lalu klik Manage di kolom Actions.

    4. Pada tab Role Permissions, temukan role_project_dev, klik Manage Members, lalu tambahkan pengguna RAM tersebut.

    Untuk informasi selengkapnya tentang pengelolaan izin MaxCompute, lihat Kelola izin pengguna menggunakan konsol.

  • Pastikan Anda telah menginstal Python versi 3.6 atau lebih baru.

Prosedur

Anda dapat menggunakan PyODPS untuk berinteraksi dengan data di MaxCompute atau Designer. Untuk informasi selengkapnya, lihat dokumentasi pengembangan PyODPS.

  1. Instal PyODPS.

    Pada terminal DSW, jalankan perintah berikut.

    pip install pyodps
  2. Jalankan perintah berikut untuk memverifikasi instalasi. Instalasi berhasil jika tidak ada nilai atau pesan error yang dikembalikan.

    # Untuk Windows, gunakan python -c "from odps import ODPS"
    python3 -c "from odps import ODPS"
  3. Jika Anda menggunakan versi Python yang bukan versi default sistem, jalankan perintah berikut untuk mengganti versi Python setelah menginstal PIP.

    /home/tops/bin/python3.7 -m pip install setuptools>=3.0
    #/home/tops/bin/python3.7 adalah path instalasi Python.
  4. Baca data MaxCompute menggunakan SQL.

    import numpy as np
    import pandas as pd
    import os
    
    from odps import ODPS
    from odps.df import DataFrame
    # Membuat koneksi.
    o = ODPS(
        os.getenv('ALIBABA_CLOUD_ACCESS_KEY_ID'),
        os.getenv('ALIBABA_CLOUD_ACCESS_KEY_SECRET'),
        project='your-default-project',
        endpoint='your-end-point',
    )
    
    # Membaca data.
    sql = '''
    SELECT  
        *
    FROM
        your-default-project.<table>
    LIMIT 100
    ;
    '''
    query_job = o.execute_sql(sql)
    result = query_job.open_reader(tunnel=True)
    df = result.to_pandas(n_process=1) # Atur n_process sesuai konfigurasi server Anda. Nilai lebih dari 1 mengaktifkan akselerasi multi-threaded.

    Di mana:

    • ALIBABA_CLOUD_ACCESS_KEY_ID dan ALIBABA_CLOUD_ACCESS_KEY_SECRET: ID AccessKey dan Rahasia AccessKey akun Alibaba Cloud Anda. Untuk mencegah risiko keamanan, konfigurasikan ID AccessKey dan Rahasia AccessKey sebagai variabel lingkungan.

      • Untuk informasi selengkapnya tentang cara mendapatkan AccessKey, lihat Buat AccessKey.

      • Untuk informasi selengkapnya tentang cara mengatur variabel lingkungan, lihat Konfigurasikan variabel lingkungan.

      • your-default-project dan your-end-point: Ganti dengan nama proyek default dan Endpoint Anda. Untuk informasi selengkapnya mengenai Endpoint di setiap wilayah, lihat Endpoint.

    Untuk informasi selengkapnya tentang cara menggunakan PyODPS untuk melakukan operasi lain pada tabel MaxCompute, seperti menulis data, lihat Tables.

Referensi

DSW menyediakan fitur SQL File yang memungkinkan Anda menggunakan pernyataan SQL untuk secara cepat mengkueri data dari sumber data MaxCompute yang memiliki izin kueri. Untuk informasi selengkapnya, lihat Gunakan SQL File untuk mengkueri tabel MaxCompute.