PyODPS adalah kit pengembangan perangkat lunak (SDK) Python untuk MaxCompute yang menyediakan operasi dasar pada objek MaxCompute serta kerangka kerja DataFrame untuk analitik data berbasis Python. Anda dapat menggunakan PyODPS di DataWorks maupun di lingkungan lokal. Topik ini menjelaskan cara menginstal PyODPS untuk digunakan di lingkungan lokal.
Prasyarat
Pastikan Anda telah menginstal Python versi 3.6 atau lebih baru.
Instal PyODPS
Buka terminal command-line dan jalankan perintah berikut untuk menginstal PyODPS.
# Untuk Windows, gunakan pip install pyodps pip3 install pyodpsJalankan perintah berikut untuk memverifikasi instalasi. Instalasi berhasil jika tidak ada nilai atau pesan error yang dikembalikan.
# Untuk Windows, gunakan python -c "from odps import ODPS" python3 -c "from odps import ODPS"
Setel variabel lingkungan
Dapatkan AccessKey dari pengguna Alibaba Cloud Resource Access Management (RAM). AccessKey ini berfungsi sebagai kredensial identitas untuk mengakses proyek MaxCompute. Untuk keamanan, setel AccessKey tersebut sebagai variabel lingkungan.
Bagian ini menggunakan sistem macOS dengan zsh sebagai contoh untuk menunjukkan cara menyetel variabel lingkungan global. Untuk informasi lebih lanjut tentang cara menyetel variabel lingkungan di sistem Linux, macOS, dan Windows, lihat Setel AccessKey Alibaba Cloud dalam variabel lingkungan.
Login ke Konsol Resource Access Management (RAM) untuk mendapatkan ID AccessKey dan Rahasia AccessKey.
Buka dan edit file konfigurasi.
-- Untuk macOS dengan zsh. Jika zsh belum terinstal, jalankan brew install zsh terlebih dahulu. vim ~/.zshrc -- Tambahkan dua baris berikut ke dalam file. -- Ganti <ACCESS_KEY_ID> dengan ID AccessKey Anda. export ALIBABA_CLOUD_ACCESS_KEY_ID=yourAccessKeyID -- Ganti <ACCESS_KEY_SECRET> dengan Rahasia AccessKey Anda. export ALIBABA_CLOUD_ACCESS_KEY_SECRET=yourAccessKeySecretMuat ulang file konfigurasi agar perubahan diterapkan.
source ~/.zshrcVerifikasi bahwa variabel lingkungan telah disetel.
echo $ALIBABA_CLOUD_ACCESS_KEY_ID echo $ALIBABA_CLOUD_ACCESS_KEY_SECRET
Langkah selanjutnya
Setelah menginstal PyODPS dan menyetel variabel lingkungan, Anda dapat menggunakan PyODPS di lingkungan lokal untuk pengembangan.
Permasalahan umum saat instalasi
Error instalasi paket dependensi
Jika terjadi error saat menginstal paket dependensi seperti numpy atau pyarrow, biasanya akan muncul error kompilasi kode C. Hal ini umumnya disebabkan oleh versi pip atau setuptools yang sudah usang. Perbarui pip dan setuptools, lalu coba instal ulang.
# Untuk Windows, gunakan pip install -U pip setuptools
pip3 install -U pip setuptoolsKonflik versi pip untuk versi Python yang berbeda
Jika Anda tidak menggunakan versi Python default sistem, jalankan perintah berikut untuk menggunakan executable Python yang benar.
/home/tops/bin/python3.7 -m pip install pyodps
#/home/tops/bin/python3.7 adalah path instalasi Python.Error versi OpenSSL urllib3
Jika Anda menemui error urllib3 v2.0 only supports OpenSSL 1.1.1+ selama instalasi, hal ini menunjukkan bahwa Python menggunakan versi OpenSSL lama yang tidak kompatibel dengan dependensi urllib3. Dalam kasus ini, instal terlebih dahulu versi urllib3 yang lebih lama, lalu instal PyODPS.
# Untuk Windows, gunakan pip install "urllib3<2.0"
pip3 install "urllib3<2.0"