本文介紹如何使用MaxCompute遠程模型自動產生電商選品描述。
情境說明
隨著電商和直播業務的飛速發展,對電商選品的“拍圖-上架”周期要求日益壓縮,傳統的人工標註方案依賴標註員經驗與主觀判斷,且海量資料處理成本高昂,長期規模化應用面臨成本與品質管控的雙重挑戰。藉助AI能力進行多模態資料處理逐漸成為主流趨勢。本文通過一個電商情境的圖片標籤和摘要產生案例,介紹如何通過Object Table訪問儲存在OSS上的非結構化資料,使用MaxCompute遠程模型和AI Function實現非結構化資料的處理。
方案優勢
通過MaxCompute Object Table的能力,可以直接存取儲存在OSS中的資料,不需要進行複雜的資料移轉。
使用者可以直接使用自己在EAS服務中部署的模型,模型服務的資源可被有效利用。
使用者無需進行複雜的自訂函數封裝,通過MaxCompute AI Function的能力,使用簡單的SQL語句就能完成圖片資料提取與加工。
環境準備
開通MaxCompute和DataWorks並建立MaxCompute專案。如已完成可跳過此步。
在人工智慧平台PAI控制台的模型線上服務(EAS)中完成多模態大語言模型的部署,詳情請參見EAS概述。如已完成可跳過此步。
開通OSS服務,並將需要處理的圖片儲存在OSS中。如已完成可跳過此步。
已將EAS公網地址設定為專案可用的MaxCompute外部網路地址,詳情請參考通過專案管理編輯外部網路地址。
資料準備
將需要處理的電商資料上傳圖片至OSS,本文樣本為50張商品海報圖片資料。資料來源於阿里雲天池公用資料集:海報設計文本映像資料集。
建立Object Table。
SET odps.namespace.schema=true; -- 開啟租戶級Schema文法開關。 CREATE OBJECT TABLE IF NOT EXISTS image_demo WITH SERDEPROPERTIES ('odps.properties.rolearn'='acs:ram::1393************:role/aliyunodpsdefaultrole') LOCATION 'oss://oss-cn-shanghai-internal.aliyuncs.com/mllm-demo/jpg-test/'; -- 重新整理,即圖片元資訊緩衝在MaxCompute中。 ALTER TABLE image_demo REFRESH METADATA; SELECT COUNT(*) AS ROW_COUNT FROM image_demo; +------------+ | row_count | +------------+ | 50 | +------------+
建立遠程模型
在PAI EAS控制台部署Omni多模態模型,擷取模型服務的名稱、訪問Endpoint和對應的Token資訊。
在MaxCompute中註冊Omni多模態遠程模型。
CREATE MODEL PAI_EAS_Qwen25_Omni_3B WITH VERSION v1 OPTIONS( MODEL_SOURCE_TYPE = 'REMOTE', MODEL_TYPE = 'MLLM', TASKS = 'text-generation', PAI_EAS_MODEL_NAME = 'Qwen2.5-Omni-3B', PAI_EAS_SERVICE_NAME = 'demo_remote_model', ENDPOINT = 'http://***********.cn-shanghai.pai-eas.aliyuncs.com', APIKEY = 'your-api-key', PAI_EAS_SYNC_MODE = 'true' ) COMMENT "PAI EAS remote model"; ALTER MODEL PAI_EAS_Qwen25_Omni_3B ADD VERSION v2 INPUT(data BINARY, promt STRING) WITH OPTIONS( MODEL_SOURCE_TYPE = 'REMOTE', MODEL_TYPE = 'MLLM', TASKS = 'text-generation', PAI_EAS_MODEL_NAME = 'Qwen2.5-Omni-3B', PAI_EAS_SERVICE_NAME = 'demo_remote_model', ENDPOINT = 'http://************.cn-shanghai.pai-eas.aliyuncs.com', APIKEY = 'your-api-key', PAI_EAS_SYNC_MODE = 'true' ) COMMENT "PAI EAS remote model binary input";查看遠程模型。
desc model PAI_EAS_Qwen25_Omni_3B; ID = 20250909024319251glhmocwqddl +------------------------------------------------------------------------------------+ | Model Information | +------------------------------------------------------------------------------------+ | Owner: ALIYUN$*********************** | | Project: pd_test_model | | Schema: default | | Model Name: PAI_EAS_Qwen25_Omni_3B | | Model Type: MLLM | | Source Type: REMOTE | | Default Version: v1 | | CreateTime: 2025-09-04 10:29:28 | | LastModifiedTime: 2025-09-09 10:43:11 | | Model ID: 46311b6397494a84ad23c5a4******** | | Comment: PAI EAS remote model url input | +------------------------------------------------------------------------------------+ | Version Information | +------------------------------------------------------------------------------------+ | Owner: ALIYUN$*********************** | | Project: pd_test_model | | Schema: default | | Model Name: PAI_EAS_Qwen25_Omni_3B | | Model Type: MLLM | | Source Type: REMOTE | | Version Name: v1 | | Version ID: c389823cd0324b72b1c0d55*********** | | Path: | | CreateTime: 2025-09-04 10:29:28 | | LastModifiedTime: 2025-09-04 10:29:28 | | apikey: Yzc4*******mNzFkMGM********4YzEwZjY1NTA*********NzkyNw== | | endpoint: http://13933481********.cn-shanghai.pai-eas.aliyuncs.com | | pai_eas_model_name: Qwen2.5-Omni-3B | | pai_eas_service_name: demo_eas_model | | pai_eas_sync_mode: true | | remote_service_type: PAI-EAS | +------------------------------------------------------------------------------------+ | Input | Type | Comment | +------------------------------------------------------------------------------------+ +------------------------------------------------------------------------------------+ OK
資料分析
使用MaxCompute AI_GENERATE函數進行圖片資料的分類和描述摘要產生:
SET odps.namespace.schema=true;
SELECT
key,
AI_GENERATE(
PAI_EAS_Qwen25_Omni_3B, v1, image_url,
"從電商商品銷售海報中識別並提取商品所屬的類目。返回結果僅限於如下六個選項之一:美妝、服裝、日用、食品、其他、電子產品,不包含其他文字或資訊"
) as item_catagory,
AI_GENERATE(
PAI_EAS_Qwen25_Omni_3B, v1, image_url,
"你是一名專業的電商文案編輯, 請根據提供的電商商品銷售海報,產生商品描述摘要。
輸出要求:1.摘要應準確反映海報中的關鍵資訊,如商品特點、促銷資訊等; 2.絕對保證語言通順和可讀,不包含任何特殊符號和亂碼,長度不超過50字;3.除商品的英文品牌名外,必須使用中文進行表述,嚴禁夾雜任何英文單詞;
樣本:純棉T恤限時優惠,買一送一,活動僅剩3天!"
) as item_description
from (
select GET_SIGNED_URL_FROM_OSS(
'pd_test_model.default.image_demo', key, 604800
) as image_url, key as key
from pd_test_model.default.image_demo
) Limit 10;
ID = 2025090909524183gsu********
Log view:
https://logview.alibaba-inc.com/logview/?h=http://server-ip:8008/daily&p=pd_test_model&i=2025********4183gsuq57sqddl&token=********
----------------------------------------------------------------------------------------------
STAGES STATUS TOTAL COMPLETED RUNNING PENDING BACKUP
M1_job_0 ................. TERMINATED 1 1 0 0 0
----------------------------------------------------------------------------------------------
STAGES: 01/01 [==========================>>] 100% ELAPSED TIME: 11.65 s
----------------------------------------------------------------------------------------------
+------+---------------+------------------+
| key | item_catagory | item_description |
+------+---------------+------------------+
| alimamazszw-1.jpg | 食品 | 西餐廳牛肉限時優惠,下單享好禮,帶有新鮮羅勒葉,美味享受不容錯過。 |
| alimamazszw-10.jpg | 電子產品 | 新功能風扇限時促銷,歷史最低價,快來選購! |
| alimamazszw-11.jpg | 電子產品 | 炫酷頭盔線上銷售,MIPS防護技術,下單立減270元,優惠至手729元,限時活動,搶購不容錯過! |
| alimamazszw-12.jpg | 美妝 | misspiggy「極細絲滑」眼線膠筆,軟糯絲滑,持久不暈妝。買買二減十,限時優惠,立即行動。 |
| alimamazszw-13.jpg | 電子產品 | 本次特價銷售的IX35雨刷,今日特惠,立即搶購。 |
| alimamazszw-14.jpg | 日用 | 北京吉田生物護科技有限公司生產的生物組織膠水,可以粘傷口,僅用於動物實驗,有效期間1年。 |
| alimamazszw-15.jpg | 美妝 | BodyAid增發精華液,喚醒毛囊,發境育發,煥發新生。 |
| alimamazszw-16.jpg | 美妝 | 3CE元氣腮紅限時優惠,買一贈一,狂歡日驚喜不斷。 |
| alimamazszw-17.jpg | 美妝 | 海藍之謎HR護膚霜,黑白封裝,6件六重好禮,下單即送價值2340元,順豐速遞,限時優惠,數量有限。 |
| alimamazszw-18.jpg | 日用 | 李施德林漱口水多種口味促銷,現有30元優惠券,數量有限,快來搶購! |
+------+---------------+------------------+
-- 如果讀BINARY。
SELECT
key,
AI_GENERATE(
PAI_EAS_Qwen25_Omni_3B, v2, image_binary,
"從電商商品銷售海報中識別並提取商品所屬的類目。返回結果僅限於如下六個選項之一:美妝、服裝、日用、食品、其他、電子產品,不包含其他文字或資訊"
) as item_catagory,
AI_GENERATE(
PAI_EAS_Qwen25_Omni_3B, v2, image_binary,
"你是一名專業的電商文案編輯, 請根據提供的電商商品銷售海報,產生商品描述摘要。
輸出要求:1.摘要應準確反映海報中的關鍵資訊,如商品特點、促銷資訊等; 2.絕對保證語言通順和可讀,不包含任何特殊符號和亂碼,長度不超過50字;3.除商品的英文品牌名外,必須使用中文進行表述,嚴禁夾雜任何英文單詞;
樣本:純棉T恤限時優惠,買一送一,活動僅剩3天!"
) as item_description
from (
select GET_DATA_FROM_OSS(
'pd_test_model.default.image_demo', key
) as image_binary, key as key
from pd_test_model.default.image_demo
) Limit 10;