全部产品
Search
文档中心

:Ikhtisar

更新时间:Jul 06, 2025

SQLML adalah portal SQL yang disediakan oleh MaxCompute untuk memanfaatkan kemampuan Platform Pembelajaran Mesin untuk AI (PAI). Pada lapisan bawah, MaxCompute SQLML bergantung pada PAI untuk membuat, memprediksi, dan mengevaluasi model. Topik ini menjelaskan fitur-fitur SQLML, termasuk model pembelajaran mesin, fungsi prediksi model, dan fungsi evaluasi model yang didukung.

Deskripsi

MaxCompute SQLML bergantung pada layanan Alibaba Cloud: MaxCompute dan PAI. Anda dapat mengembangkan pekerjaan MaxCompute SQLML di DataWorks, menganalisis data MaxCompute menggunakan PAI, dan menggunakan model pembelajaran mesin untuk membuat prediksi. Hasil-hasil ini dapat digunakan untuk membimbing perencanaan bisnis.
  • MaxCompute: menyediakan SQLML, sebuah portal SQL untuk menggunakan PAI.
  • Klien: platform operasi SQL. Anda dapat memilih DataWorks (disarankan), MaxCompute SDK (Java SDK atau Python SDK), MaxCompute odpscmd, atau MaxCompute Studio.
  • PAI: menyediakan model pembelajaran mesin.

MaxCompute SQLML membantu pengembang data, analis, dan ilmuwan data menggunakan SQL untuk membuat, melatih, dan menerapkan model pembelajaran mesin. Ini juga memungkinkan praktisi SQL menggunakan keterampilan mereka untuk mengimplementasikan kemampuan PAI tanpa perlu memindahkan data.

Catatan penggunaan

Berikut adalah prosedur penggunaan MaxCompute SQLML:
  1. Aktifkan MaxCompute, DataWorks Basic, dan Pay-As-You-Go (PAI Studio, DSW, dan EAS).
  2. Siapkan dataset.

    Dataset digunakan untuk melatih dan memprediksi model.

  3. Buat atau konfigurasikan ruang kerja DataWorks. Atur Compute Engines ke MaxCompute dan Layanan Pembelajaran Mesin ke PAI Studio.
  4. Gunakan DataWorks untuk membuat tabel dan impor data dari dataset ke dalam tabel.
  5. Proses data yang diimpor sesuai dengan persyaratan model tertentu dan buat set data pelatihan dan set data uji. Set data pelatihan digunakan untuk melatih model, sedangkan set data uji digunakan untuk memprediksi model.
  6. Buat model pembelajaran mesin dan gunakan fungsi prediksi model yang disediakan oleh MaxCompute untuk membuat prediksi.
  7. Evaluasi akurasi hasil prediksi menggunakan fungsi evaluasi model yang disediakan oleh MaxCompute.

Untuk contoh penggunaan, lihat Memulai.

Model pembelajaran mesin yang didukung

MaxCompute SQLML mendukung model pembelajaran mesin berikut:
  • Regresi logistik untuk klasifikasi biner: Nama modelnya adalah logisticregression_binary. Untuk informasi lebih lanjut, lihat Linear SVM.
  • Regresi logistik untuk klasifikasi multikelas: Nama modelnya adalah logisticregression_multi. Untuk informasi lebih lanjut, lihat PS-SMART Multiclass Classification.
  • Regresi linier: Nama modelnya adalah linearregression. Untuk informasi lebih lanjut, lihat GBDT Regression.

Fungsi prediksi model yang didukung

MaxCompute SQLML mendukung fungsi prediksi model ml_predict. Sintaks:
ml_predict(model <model_name>, table <data_source>[, map<string, string> <parameters>])
  • model_name: wajib. Menentukan nama model yang ingin dibuat.
  • data_source: wajib. Menentukan sumber data yang digunakan untuk prediksi, bisa berupa tabel atau pernyataan SELECT.
  • parameters: opsional. Menentukan parameter yang digunakan untuk prediksi, sama dengan yang ada di PAI. Untuk informasi lebih lanjut tentang parameter, lihat Linear SVM, PS-SMART Multiclass Classification, atau GBDT Regression.

Fungsi evaluasi model yang didukung

MaxCompute SQLML mendukung fungsi evaluasi model berikut untuk mengevaluasi akurasi hasil prediksi:
  • Evaluasi klasifikasi biner: diimplementasikan menggunakan fungsi bawaan ml_evaluate. Anda dapat mengevaluasi model menggunakan indeks seperti luas di bawah kurva (AUC), Kolmogorov-Smirnov (KS), dan Skor F1. Sintaks:
    ml_evaluate(table <data_source>[, map<string, string> <parameters>])
  • Evaluasi klasifikasi multikelas: diimplementasikan menggunakan fungsi bawaan ml_multiclass_evaluate. Anda dapat mengevaluasi model klasifikasi multikelas berdasarkan hasil prediksi dan aktualnya. Indeks evaluasi termasuk akurasi, kappa, dan Skor F1. Sintaks:
    ml_multiclass_evaluate(table <data_source>[, map<string, string> <parameters>])
  • Evaluasi regresi linier: diimplementasikan menggunakan fungsi bawaan ml_regression_evaluate. Anda dapat mengevaluasi model algoritma linier berdasarkan hasil prediksi dan aktualnya, seperti indeks dan histogram residual. Indeks evaluasi termasuk SST, SSE, SSR, R2, R, MSE, RMSE, MAE, MAD, MAPE, jumlah, yMean, dan predictMean. Sintaks:
    ml_regression_evaluate(table <data_source>[, map<string, string> <parameters>])
Dalam sintaks sebelumnya:
  • data_source: wajib. Menentukan data yang akan dievaluasi, termasuk hasil label dan hasil prediksi. Nilainya bisa berupa tabel atau pernyataan SELECT.
  • parameters: opsional. Menentukan parameter yang digunakan untuk prediksi, sama dengan yang ada di PAI. Untuk informasi lebih lanjut tentang parameter, lihat Linear SVM, PS-SMART Multiclass Classification, atau GBDT Regression.