Model Gallery預置了中文標題產生模型,您可以直接部署該模型。針對定製化情境,您也可以使用自己的資料集對模型進行微調訓練。本文為您介紹如何在Model Gallery完成中文標題產生任務。
前提條件
已建立OSS Bucket儲存空間,具體操作請參見控制台建立儲存空間。
一、進入模型詳情頁面
進入Model Gallery頁面。
登入PAI控制台。
在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。
在左側導覽列單擊快速開始 > Model Gallery,進入Model Gallery頁面。
在Model Gallery首頁,搜尋EasyNLP_pai_mt5_title_generation_zh,單擊對應模型卡片,進入模型詳情頁面。
二、直接部署和調試模型
部署模型服務
在模型詳情頁面,單擊模型部署。
在模型部署詳情頁面,確認部署資訊後,單擊部署。
在計費提醒對話方塊中,單擊確定。
頁面將自動跳轉到服務詳情頁面。您可以在基本資料地區查看服務狀態。當狀態變為運行中時,表明服務部署成功。
線上調試模型
通過控制台進行線上調試
在服務詳情頁面的線上預測文字框中輸入請求資料,請求資料樣本如下。
{ "data": ["在廣州第一人民醫院,一個上午6名患者做支氣管鏡檢查,5人查出肺癌,且4人是老煙民!專家稱,吸煙和被動吸煙是肺癌的主要元兇。"] }
單擊發送請求。
您可以在頁面下方查看輸出結果。

通過Python代碼進行線上調試
查看服務的調用資訊。
在服務詳情頁面的資源資訊地區,單擊查看調用資訊。

在調用資訊對話方塊的公網地址調用頁簽中,查看訪問地址和Token,並儲存到本地。
使用以下範例程式碼發送服務要求。
import requests url = "<PredictionServiceEndpoint>" token = "<PredictionServiceAccessToken>" request_body = '{"data": ["在廣州第一人民醫院,一個上午6名患者做支氣管鏡檢查,5人查出肺癌,且4人是老煙民!專家稱,吸煙和被動吸煙是肺癌的主要元兇。"]}' request_body = request_body.encode('utf-8') headers = {"Authorization": token} resp = requests.post(url=url, headers=headers, data=request_body) print(resp.content.decode()) print("status code:", resp.status_code)其中:url和token需要分別配置為上述步驟中儲存到本地的訪問地址和Token。
系統返回結果如下圖所示。

三、微調訓練模型
(可選)準備資料集。
說明如果您希望使用自己的資料來微調訓練模型,可以按照以下操作步驟來準備訓練資料集。
Model Gallery提供了訓練資料集。您可以使用預設資料集,也可以自己準備資料。訓練資料格式為:
{"text": "<text>", "summary": "summary"} {"text": "<text>", "summary": "summary"} {"text": "<text>", "summary": "summary"} ...... {"text": "<text>", "summary": "summary"}將已準備的資料上傳到OSS儲存空間,具體操作,請參見控制台上傳檔案。
提交訓練作業。
返回模型詳情頁面,具體操作,請參見一、進入模型詳情頁面。
在模型訓練地區,將訓練設定>輸出路徑配置為OSS Bucket路徑,並單擊訓練。本樣本使用預設資料集進行模型微調訓練。
說明如果您準備了訓練資料集,在模型訓練地區,參照訓練模型操作步驟更新訓練資料集後,再單擊訓練。
頁面將自動跳轉到任務詳情頁面。您可以單擊任務日誌,查看訓練過程。
