全部產品
Search
文件中心

MaxCompute:使用MaxCompute遠程模型自動產生電商選品描述

更新時間:Nov 26, 2025

本文介紹如何使用MaxCompute遠程模型自動產生電商選品描述。

情境說明

隨著電商和直播業務的飛速發展,對電商選品的“拍圖-上架”周期要求日益壓縮,傳統的人工標註方案依賴標註員經驗與主觀判斷,且海量資料處理成本高昂,長期規模化應用面臨成本與品質管控的雙重挑戰。藉助AI能力進行多模態資料處理逐漸成為主流趨勢。本文通過一個電商情境的圖片標籤和摘要產生案例,介紹如何通過Object Table訪問儲存在OSS上的非結構化資料,使用MaxCompute遠程模型和AI Function實現非結構化資料的處理。

方案優勢

  • 通過MaxCompute Object Table的能力,可以直接存取儲存在OSS中的資料,不需要進行複雜的資料移轉。

  • 使用者可以直接使用自己在EAS服務中部署的模型,模型服務的資源可被有效利用。

  • 使用者無需進行複雜的自訂函數封裝,通過MaxCompute AI Function的能力,使用簡單的SQL語句就能完成圖片資料提取與加工。

環境準備

資料準備

  1. 將需要處理的電商資料上傳圖片至OSS,本文樣本為50張商品海報圖片資料。資料來源於阿里雲天池公用資料集:海報設計文本映像資料集

  2. 建立Object Table。

    SET odps.namespace.schema=true; -- 開啟租戶級Schema文法開關。
    
    CREATE OBJECT TABLE IF NOT EXISTS image_demo
    WITH SERDEPROPERTIES ('odps.properties.rolearn'='acs:ram::1393************:role/aliyunodpsdefaultrole')
    LOCATION 'oss://oss-cn-shanghai-internal.aliyuncs.com/mllm-demo/jpg-test/';
    
    -- 重新整理,即圖片元資訊緩衝在MaxCompute中。
    ALTER TABLE image_demo REFRESH METADATA;
    
    SELECT COUNT(*) AS ROW_COUNT FROM image_demo; 
    
    +------------+
    | row_count  |
    +------------+
    | 50         |
    +------------+

建立遠程模型

  1. 在PAI EAS控制台部署Omni多模態模型,擷取模型服務的名稱、訪問Endpoint和對應的Token資訊。

  2. 在MaxCompute中註冊Omni多模態遠程模型。

    CREATE MODEL PAI_EAS_Qwen25_Omni_3B WITH VERSION v1 
    OPTIONS(
        MODEL_SOURCE_TYPE = 'REMOTE',
        MODEL_TYPE = 'MLLM',
        TASKS = 'text-generation',
        PAI_EAS_MODEL_NAME = 'Qwen2.5-Omni-3B',
        PAI_EAS_SERVICE_NAME = 'demo_remote_model', 
        ENDPOINT = 'http://***********.cn-shanghai.pai-eas.aliyuncs.com',
        APIKEY = 'your-api-key',
        PAI_EAS_SYNC_MODE = 'true'
    )
    COMMENT "PAI EAS remote model";
    
    
    ALTER MODEL PAI_EAS_Qwen25_Omni_3B ADD VERSION v2 
    INPUT(data BINARY, promt STRING) 
    WITH OPTIONS(
        MODEL_SOURCE_TYPE = 'REMOTE',
        MODEL_TYPE = 'MLLM',
        TASKS = 'text-generation',
        PAI_EAS_MODEL_NAME = 'Qwen2.5-Omni-3B',
        PAI_EAS_SERVICE_NAME = 'demo_remote_model', 
        ENDPOINT = 'http://************.cn-shanghai.pai-eas.aliyuncs.com',
        APIKEY = 'your-api-key',
        PAI_EAS_SYNC_MODE = 'true'
    )
    COMMENT "PAI EAS remote model binary input";
  3. 查看遠程模型。

    desc model PAI_EAS_Qwen25_Omni_3B;
    
    ID = 20250909024319251glhmocwqddl
    +------------------------------------------------------------------------------------+
    |                  Model Information                                                 |
    +------------------------------------------------------------------------------------+
    | Owner:                    ALIYUN$***********************                           |
    | Project:                  pd_test_model                                            |
    | Schema:                   default                                                  |
    | Model Name:               PAI_EAS_Qwen25_Omni_3B                                   |
    | Model Type:               MLLM                                                     |
    | Source Type:              REMOTE                                                   |
    | Default Version:          v1                                                       |
    | CreateTime:               2025-09-04 10:29:28                                      |
    | LastModifiedTime:         2025-09-09 10:43:11                                      |
    | Model ID:                 46311b6397494a84ad23c5a4********                         |
    | Comment:                  PAI EAS remote model url input                           |
    +------------------------------------------------------------------------------------+
    |                Version Information                                                 |
    +------------------------------------------------------------------------------------+
    | Owner:                    ALIYUN$***********************                           |
    | Project:                  pd_test_model                                            |
    | Schema:                   default                                                  |
    | Model Name:               PAI_EAS_Qwen25_Omni_3B                                   |
    | Model Type:               MLLM                                                     |
    | Source Type:              REMOTE                                                   |
    | Version Name:             v1                                                       |
    | Version ID:               c389823cd0324b72b1c0d55***********                       |
    | Path:                                                                              |
    | CreateTime:               2025-09-04 10:29:28                                      |
    | LastModifiedTime:         2025-09-04 10:29:28                                      |
    | apikey:                   Yzc4*******mNzFkMGM********4YzEwZjY1NTA*********NzkyNw== |
    | endpoint:                 http://13933481********.cn-shanghai.pai-eas.aliyuncs.com |
    | pai_eas_model_name:       Qwen2.5-Omni-3B                                          |
    | pai_eas_service_name:     demo_eas_model                                           |
    | pai_eas_sync_mode:        true                                                     |
    | remote_service_type:      PAI-EAS                                                  |
    +------------------------------------------------------------------------------------+
    | Input           | Type       | Comment                                             |
    +------------------------------------------------------------------------------------+
    +------------------------------------------------------------------------------------+
    
    OK

資料分析

使用MaxCompute AI_GENERATE函數進行圖片資料的分類和描述摘要產生:

SET odps.namespace.schema=true; 

SELECT
  key,
  AI_GENERATE(
    PAI_EAS_Qwen25_Omni_3B, v1, image_url,
    "從電商商品銷售海報中識別並提取商品所屬的類目。返回結果僅限於如下六個選項之一:美妝、服裝、日用、食品、其他、電子產品,不包含其他文字或資訊"
  ) as item_catagory,
  AI_GENERATE(
    PAI_EAS_Qwen25_Omni_3B, v1, image_url,
    "你是一名專業的電商文案編輯, 請根據提供的電商商品銷售海報,產生商品描述摘要。
     輸出要求:1.摘要應準確反映海報中的關鍵資訊,如商品特點、促銷資訊等; 2.絕對保證語言通順和可讀,不包含任何特殊符號和亂碼,長度不超過50字;3.除商品的英文品牌名外,必須使用中文進行表述,嚴禁夾雜任何英文單詞;
     樣本:純棉T恤限時優惠,買一送一,活動僅剩3天!"
  ) as item_description
  from (
    select GET_SIGNED_URL_FROM_OSS(
      'pd_test_model.default.image_demo', key, 604800
    ) as image_url, key as key
    from pd_test_model.default.image_demo
) Limit 10;


ID = 2025090909524183gsu********
Log view:
https://logview.alibaba-inc.com/logview/?h=http://server-ip:8008/daily&p=pd_test_model&i=2025********4183gsuq57sqddl&token=********
----------------------------------------------------------------------------------------------
                    STAGES        STATUS  TOTAL  COMPLETED  RUNNING  PENDING  BACKUP
M1_job_0 .................    TERMINATED      1          1        0        0       0
----------------------------------------------------------------------------------------------
STAGES: 01/01    [==========================>>] 100%  ELAPSED TIME: 11.65 s    
----------------------------------------------------------------------------------------------
+------+---------------+------------------+
| key  | item_catagory | item_description |
+------+---------------+------------------+
| alimamazszw-1.jpg | 食品        | 西餐廳牛肉限時優惠,下單享好禮,帶有新鮮羅勒葉,美味享受不容錯過。 |
| alimamazszw-10.jpg | 電子產品  | 新功能風扇限時促銷,歷史最低價,快來選購! |
| alimamazszw-11.jpg | 電子產品  | 炫酷頭盔線上銷售,MIPS防護技術,下單立減270元,優惠至手729元,限時活動,搶購不容錯過! |
| alimamazszw-12.jpg | 美妝        | misspiggy「極細絲滑」眼線膠筆,軟糯絲滑,持久不暈妝。買買二減十,限時優惠,立即行動。 |
| alimamazszw-13.jpg | 電子產品  | 本次特價銷售的IX35雨刷,今日特惠,立即搶購。 |
| alimamazszw-14.jpg | 日用        | 北京吉田生物護科技有限公司生產的生物組織膠水,可以粘傷口,僅用於動物實驗,有效期間1年。 |
| alimamazszw-15.jpg | 美妝        | BodyAid增發精華液,喚醒毛囊,發境育發,煥發新生。 |
| alimamazszw-16.jpg | 美妝        | 3CE元氣腮紅限時優惠,買一贈一,狂歡日驚喜不斷。 |
| alimamazszw-17.jpg | 美妝        | 海藍之謎HR護膚霜,黑白封裝,6件六重好禮,下單即送價值2340元,順豐速遞,限時優惠,數量有限。 |
| alimamazszw-18.jpg | 日用        | 李施德林漱口水多種口味促銷,現有30元優惠券,數量有限,快來搶購! |
+------+---------------+------------------+

-- 如果讀BINARY。
SELECT
  key,
  AI_GENERATE(
    PAI_EAS_Qwen25_Omni_3B, v2, image_binary,
    "從電商商品銷售海報中識別並提取商品所屬的類目。返回結果僅限於如下六個選項之一:美妝、服裝、日用、食品、其他、電子產品,不包含其他文字或資訊"
  ) as item_catagory,
  AI_GENERATE(
    PAI_EAS_Qwen25_Omni_3B, v2, image_binary,
    "你是一名專業的電商文案編輯, 請根據提供的電商商品銷售海報,產生商品描述摘要。
     輸出要求:1.摘要應準確反映海報中的關鍵資訊,如商品特點、促銷資訊等; 2.絕對保證語言通順和可讀,不包含任何特殊符號和亂碼,長度不超過50字;3.除商品的英文品牌名外,必須使用中文進行表述,嚴禁夾雜任何英文單詞;
     樣本:純棉T恤限時優惠,買一送一,活動僅剩3天!"
  ) as item_description
  from (
    select GET_DATA_FROM_OSS(
      'pd_test_model.default.image_demo', key
    ) as image_binary, key as key
    from pd_test_model.default.image_demo
) Limit 10;