Pada instans Data Science Workshop (DSW), Anda dapat menggunakan PyODPS untuk membaca data dari MaxCompute.
Persiapan
Sebelum memulai, lengkapi persiapan berikut:
MaxCompute telah diaktifkan. Untuk informasi selengkapnya, lihat Aktifkan MaxCompute.
Akun Anda memiliki izin yang diperlukan untuk mengoperasikan proyek MaxCompute. Jika Anda menggunakan akun root untuk login ke instans DSW, tidak diperlukan otorisasi tambahan. Jika Anda menggunakan pengguna Resource Access Management (RAM), berikan izin kepada pengguna RAM tersebut sebagai berikut.
Pastikan Anda telah menginstal Python versi 3.6 atau lebih baru.
Prosedur
Anda dapat menggunakan PyODPS untuk berinteraksi dengan data di MaxCompute atau Designer. Untuk informasi selengkapnya, lihat dokumentasi pengembangan PyODPS.
Instal PyODPS.
Pada terminal DSW, jalankan perintah berikut.
pip install pyodpsJalankan perintah berikut untuk memverifikasi instalasi. Instalasi berhasil jika tidak ada nilai atau pesan error yang dikembalikan.
# Untuk Windows, gunakan python -c "from odps import ODPS" python3 -c "from odps import ODPS"Jika Anda menggunakan versi Python yang bukan versi default sistem, jalankan perintah berikut untuk mengganti versi Python setelah menginstal PIP.
/home/tops/bin/python3.7 -m pip install setuptools>=3.0 #/home/tops/bin/python3.7 adalah path instalasi Python.Baca data MaxCompute menggunakan SQL.
import numpy as np import pandas as pd import os from odps import ODPS from odps.df import DataFrame # Membuat koneksi. o = ODPS( os.getenv('ALIBABA_CLOUD_ACCESS_KEY_ID'), os.getenv('ALIBABA_CLOUD_ACCESS_KEY_SECRET'), project='your-default-project', endpoint='your-end-point', ) # Membaca data. sql = ''' SELECT * FROM your-default-project.<table> LIMIT 100 ; ''' query_job = o.execute_sql(sql) result = query_job.open_reader(tunnel=True) df = result.to_pandas(n_process=1) # Atur n_process sesuai konfigurasi server Anda. Nilai lebih dari 1 mengaktifkan akselerasi multi-threaded.Di mana:
ALIBABA_CLOUD_ACCESS_KEY_ID dan ALIBABA_CLOUD_ACCESS_KEY_SECRET: ID AccessKey dan Rahasia AccessKey akun Alibaba Cloud Anda. Untuk mencegah risiko keamanan, konfigurasikan ID AccessKey dan Rahasia AccessKey sebagai variabel lingkungan.
Untuk informasi selengkapnya tentang cara mendapatkan AccessKey, lihat Buat AccessKey.
Untuk informasi selengkapnya tentang cara mengatur variabel lingkungan, lihat Konfigurasikan variabel lingkungan.
your-default-project dan your-end-point: Ganti dengan nama proyek default dan Endpoint Anda. Untuk informasi selengkapnya mengenai Endpoint di setiap wilayah, lihat Endpoint.
Untuk informasi selengkapnya tentang cara menggunakan PyODPS untuk melakukan operasi lain pada tabel MaxCompute, seperti menulis data, lihat Tables.
Referensi
DSW menyediakan fitur SQL File yang memungkinkan Anda menggunakan pernyataan SQL untuk secara cepat mengkueri data dari sumber data MaxCompute yang memiliki izin kueri. Untuk informasi selengkapnya, lihat Gunakan SQL File untuk mengkueri tabel MaxCompute.