全部产品
Search
文档中心

MaxCompute:Lakukan analisis sentimen pada komentar daring menggunakan model publik MaxCompute

更新时间:Nov 11, 2025

Topik ini menjelaskan cara menggunakan model publik MaxCompute untuk melakukan analisis sentimen pada komentar daring.

Deskripsi skenario

Pertumbuhan pesat media sosial dan e-commerce telah memicu lonjakan komentar pengguna daring. Komentar-komentar tersebut kaya akan sentimen dan opini publik. Analisis sentimen terhadap komentar ini telah menjadi alat penting untuk pemantauan opini publik, manajemen merek, dan optimalisasi produk. Topik ini menyajikan contoh dunia nyata tentang cara menggunakan SQL di MaxCompute untuk memanggil fungsi AI. Dengan memanfaatkan model besar publik bawaan, seperti Qwen3-0.6B-GGUF, Anda dapat langsung mengklasifikasikan sentimen dan mengekstraksi informasi geografis dari komentar dalam lingkungan yang aman dan terkendali—tanpa perlu menerapkan model, menggunakan layanan eksternal, atau memindahkan data. Pendekatan ini secara signifikan meningkatkan efisiensi dan kenyamanan analisis Anda.

Keunggulan

  • Anda dapat menjalankan tugas analisis data kompleks, seperti analisis sentimen teks, hanya dengan SQL sederhana menggunakan model publik MaxCompute dan fungsi AI—tanpa perlu menerapkan model atau mengembangkan fungsi tambahan.

  • Seluruh proses analisis berlangsung sepenuhnya di dalam platform, sehingga menjamin keamanan dan kepatuhan data tanpa migrasi data atau ketergantungan pada layanan eksternal.

  • Pendekatan ini menurunkan hambatan masuk dan meningkatkan efisiensi analisis. Dibandingkan dengan metode tradisional seperti tabel pemetaan statis atau ekspresi reguler, pendekatan ini menawarkan ekstensibilitas dan fleksibilitas yang lebih tinggi, mampu menangani hubungan kompleks tanpa biaya pemeliharaan yang besar, sehingga lebih mudah digunakan dan lebih ramah bisnis.

Prasyarat

Aktifkan MaxCompute dan buat proyek MaxCompute. Jika Anda telah melakukannya, lewati langkah ini.

Persiapkan data

Perintah dalam contoh ini dijalankan pada klien lokal (odpscmd).

Buat tabel

Untuk informasi selengkapnya, lihat Buat dan hapus tabel.

CREATE TABLE IF NOT EXISTS emotional_comment
(
    content_id      STRING COMMENT 'ID komentar',
    text            STRING COMMENT 'Isi komentar',
    publish_time    STRING COMMENT 'Waktu komentar',
    user_id         STRING COMMENT 'ID pengguna',
    user_followers  STRING COMMENT 'Jumlah pengikut pengguna',
    user_region     STRING COMMENT 'Wilayah pengguna',
    repost_count    STRING COMMENT 'Jumlah repost',
    comment_count   STRING COMMENT 'Jumlah komentar',
    quote_count     STRING COMMENT 'Jumlah suka'
);

Impor data

Unduh file data sampel: demo_comment.csv.

TUNNEL UPLOAD demo_comment.csv emotional_comment;

SELECT * FROM emotional_comment LIMIT 10;

+------------------+--------------------------------------------------------------------------------------------------+---------------+------------+----------------+-------------+--------------+---------------+-------------+
| content_id       | text                                                                                             | publish_time  | user_id    | user_followers | user_region | repost_count | comment_count | quote_count |
+------------------+--------------------------------------------------------------------------------------------------+---------------+------------+----------------+-------------+--------------+---------------+-------------+
| 5087a5a3c22e3f4c | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. | 2025/5/27 12:49 | user_918561 | 132.169        | Xi'an       | 1.015        | 3.197         | 1.300       |
| 299aa8f97b6fee2f | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. | 2025/5/31 07:46 | user_403208 | 669.019        | Hohhot      | 6.616        | 4.876         | 201         |
| e7ee00dec51b28f6 | Teknologi berkembang pesat, dan artificial intelligence mengubah kehidupan.                         | 2025/5/17 11:39 | user_291936 | 840.757        | Nanning     | 264          | 3.668         | 174         |
| 0c0d61608cabbac3 | Langkah-langkah pengendalian sangat baik. Salut untuk staf medis!                                   | 2025/5/18 03:29 | user_154572 | 925.604        | Fuzhou      | 2.154        | 652           | 470         |
| 106b979787b580d1 | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. | 2025/5/28 14:45 | user_528807 | 656.952        | Qingdao     | 6.617        | 3.890         | 1.275       |
| 05b0e2ef4636d5c9 | Kesadaran lingkungan perlu ditingkatkan lebih lanjut untuk melindungi planet kita.                  | 2025/5/16 09:06 | user_693289 | 211.093        | Foshan      | 4.283        | 1.592         | 1.792       |
| c9773c4a632a8839 | Layanan di restoran ini luar biasa, dan makanannya lezat. Sangat direkomendasikan.                   | 2025/5/21 19:19 | user_850376 | 817.461        | Shenyang    | 9.552        | 3.974         | 1.740       |
| 089e0c5dddc53198 | Kesadaran lingkungan perlu ditingkatkan lebih lanjut untuk melindungi planet kita.                  | 2025/5/17 10:58 | user_800324 | 716.599        | Harbin      | 5.725        | 4.437         | 939         |
| 04fd7323a957d978 | Efek dari langkah-langkah reformasi pendidikan perlu lebih banyak waktu untuk diamati.              | 2025/5/26 01:25 | user_544689 | 416.372        | Hefei       | 1.440        | 4.185         | 416         |
| 04cf4066c5c1e9c7 | Layanan di restoran ini luar biasa, dan makanannya lezat. Sangat direkomendasikan.                   | 2025/5/27 03:49 | user_373334 | 722.353        | Changchun   | 1.134        | 3.936         | 773         |
+------------------+--------------------------------------------------------------------------------------------------+---------------+------------+----------------+-------------+--------------+---------------+-------------+

Lihat model publik

Jalankan perintah SQL berikut untuk melihat model publik Qwen3-0.6B.

-- Setel flag.
SET odps.task.major.version=flighting;
SET odps.sql.using.public.model=true;
SET odps.namespace.schema=false;

-- Lihat detail model publik.
DESC MODEL bigdata_public_modelset.Qwen3-0.6B-GGUF;

+------------------------------------------------------------------------------------+
|                  Informasi Model                                                   |
+------------------------------------------------------------------------------------+
| Pemilik:                  ALIYUN$od**@aliyun-inner.com                              |
| Proyek:                   bigdata_public_modelset                                   |
| Nama Model:               Qwen3-0.6B-GGUF                                           |
| Jenis Model:              LLM                                                       |
| Jenis Sumber:             IMPORT                                                    |
| Versi Default:            v1                                                        |
| Waktu Pembuatan:          2025-09-25 23:35:31                                       |
| Waktu Modifikasi Terakhir:2025-09-25 23:35:31                                       |
| Komentar:                 Model LLM Publik MaxCompute Qwen3-0.6B-GGUF dengan kuantisasi campuran 8-bit (Q8_0), menggunakan pengaturan default {"max_tokens": 500, "temperature": 0.6, "top_p": 0.95}. Sumber:https://huggingface.co/unsloth/Qwen3-0.6B-GGUF |
+------------------------------------------------------------------------------------+
|                Informasi Versi                                                     |
+------------------------------------------------------------------------------------+
| Pemilik:                  ALIYUN$****@aliyun-inner.com                              |
| Proyek:                   bigdata_public_modelset                                   |
| Nama Model:               Qwen3-0.6B-GGUF                                           |
| Jenis Model:              LLM                                                       |
| Jenis Sumber:             IMPORT                                                    |
| Nama Versi:               v1                                                        |
| Jalur:                                                                              |
| Waktu Pembuatan:          2025-09-25 23:35:31                                       |
| Waktu Modifikasi Terakhir:2025-09-25 23:35:31                                       |
+------------------------------------------------------------------------------------+
| Input           | Jenis      | Komentar                                              |
+------------------------------------------------------------------------------------+
| prompt          | string     |                                                       |
| settings        | string     |                                                       |
+------------------------------------------------------------------------------------+

Analisis data

Kode contoh berikut menunjukkan cara menggunakan fungsi AI_GENERATE di MaxCompute dengan model besar publik Qwen3-0.6B-GGUF. Dalam satu kueri SQL, Anda dapat menjalankan dua tugas inferensi AI:

  1. Penguraian informasi geografis: Secara otomatis menentukan wilayah administratif provinsi (misalnya "Provinsi Shaanxi") berdasarkan nama kota dalam komentar pengguna (misalnya "Xi'an").

  2. Klasifikasi sentimen: Melakukan analisis sentimen pada teks komentar dan menghasilkan label standar ("Positive", "Negative", atau "Neutral").

Untuk informasi selengkapnya tentang penggunaan fungsi tersebut, lihat AI_GENERATE.

-- Panggil model Qwen3 bawaan menggunakan fungsi AI_GENERATE untuk menghasilkan nama provinsi dan label analisis sentimen.
SELECT 
  AI_GENERATE(
    bigdata_public_modelset.Qwen3-0.6B-GGUF,
    default_version,
    CONCAT(
      'Berikan provinsi untuk kota berikut. Jika kota tersebut merupakan kotamadya atau wilayah administrasi khusus, tampilkan langsung nama kotanya. Keluaran hanya boleh berisi nama provinsi. Nama kota:',user_region),
    '{"max_tokens": 1000, "temperature": 0.7}'
  ) as province,
  user_region,
  AI_GENERATE(
    bigdata_public_modelset.Qwen3-0.6B-GGUF,
    default_version,
    CONCAT(
      'Lakukan analisis dan klasifikasi sentimen pada komentar berikut. Keluaran harus salah satu dari tiga opsi berikut: Positive, Negative, atau Neutral. Komentar untuk dianalisis:', text),
    '{"max_tokens": 1000, "temperature": 0.7}'
  ) as sentiment_label,
  text
  FROM emotional_comment limit 20
;

+------------------------------------+----------------+--------------------+--------------------------------------------------------------------------------------------------+
| province                           | user_region    | sentiment_label    | text                                                                                             |
+------------------------------------+----------------+--------------------+--------------------------------------------------------------------------------------------------+
| "Provinsi Shaanxi"                 | Xi'an          | "Positive"         | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. |
| "Daerah Otonom Mongolia Dalam"     | Hohhot         | "Positive"         | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. |
| "Guangxi"                          | Nanning        | "Positive"         | Teknologi berkembang pesat, dan artificial intelligence mengubah kehidupan.                        |
| "Provinsi Fujian"                  | Fuzhou         | "Positive"         | Langkah-langkah pengendalian sangat baik. Salut untuk staf medis!                                  |
| "Provinsi Hebei"                   | Qingdao        | "Positive"         | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. |
| "Provinsi Gansu"                   | Lanzhou        | "Neutral"          | Efek dari langkah-langkah reformasi pendidikan perlu lebih banyak waktu untuk diamati.              |
| "Provinsi Fujian"                  | Fuzhou         | "Positive"         | Teknologi berkembang pesat, dan artificial intelligence mengubah kehidupan.                        |
| "Provinsi Hunan"                   | Changsha       | "Negative"         | Saya sangat menentang langkah ini. Ini sama sekali tidak masuk akal!                               |
| "Provinsi Sichuan"                 | Chongqing      | "Positive"         | Langkah-langkah pengendalian sangat baik. Salut untuk staf medis!                                  |
| "Provinsi Guangdong"               | Guangzhou      | "Positive"         | Masalah keamanan pangan tidak bisa diabaikan. Regulasi harus lebih ketat.                          |
| "Provinsi Shaanxi"                 | Xi'an          | "Negative"         | Pasar saham sangat fluktuatif belakangan ini. Berinvestasilah dengan hati-hati.                    |
| "Provinsi Shandong"                | Jinan          | "Positive"         | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. |
| "Provinsi Hebei"                   | Tianjin        | "Positive"         | Peluncuran produk baru sukses. Menantikan perkembangan di masa depan.                              |
| "Provinsi Hebei"                   | Tianjin        | "Positive"         | Cuaca hari ini sangat bagus, dan saya sedang dalam suasana hati yang baik! Cerah dan sempurna untuk jalan-jalan. |
| "Xinjiang"                         | Urumqi         | "Negative"         | Harga properti naik lagi. Tekanan bagi kaum muda untuk membeli rumah semakin meningkat.            |
| "Guangxi"                          | Nanning        | "Positive"         | Peluncuran produk baru sukses. Menantikan perkembangan di masa depan.                              |
| "Provinsi Qinghai"                 | Xining         | "Positive"         | Acara olahraga spektakuler. Maju atlet!                                                            |
| "Provinsi Heilongjiang"            | Harbin         | "Negative"         | Pasar saham sangat fluktuatif belakangan ini. Berinvestasilah dengan hati-hati.                    |
| "Provinsi Heilongjiang"            | Harbin         | "Positive"         | Acara olahraga spektakuler. Maju atlet!                                                            |
| "Provinsi Jiangsu"                 | Nanjing        | "Negative"         | Kemacetan lalu lintas sangat parah. Saya terlambat setengah jam ke kantor. Sangat menjengkelkan.    |
+------------------------------------+----------------+--------------------+--------------------------------------------------------------------------------------------------+