使用Kohya訓練LoRA模型-人工智慧平台 PAI-阿里雲

本文介紹Kohya工具使用說明。

點擊登入PAI ArtLab控制台。

前提條件

已完成PAI ArtLab 開通與認證授權。
（可選）已領取免費試用資源/代金券，或購買資源套件，詳情請參見PAI ArtLab計費說明。
請在資源/代金券或資源套件有效期間內使用，詳情請參見查看使用額度和期限。

本文以使用Kohya（專享版）訓練油畫模型，並基於該模型產生油畫風格的圖片為例進行說明。建議您自行準備15張解析度為768*768px的油畫自然景觀映像作為模型訓練的資料集，按照如下步驟完成該模型訓練。

登入PAI ArtLab，滑鼠移至上方右上方，選擇华东2（上海）地區。
在数据集頁面，單擊新建数据集，設定資料集名稱。
進入該資料集，單擊新建資料夾，設定檔案夾名稱。
檔案夾名稱格式：數字_任意名稱，數字代表訓練時的repeat值。例如，30_test。
上傳圖片至已建立的檔案夾。圖片要求如下：
- 畫面內容清晰，建議選擇15張以上的圖片。
- 避免像素過高，以sd1.5基模的LoRA訓練為例，映像像素在512*512或者512*768即可。
- 避免包含浮水印、低清晰度、怪異的光線、複雜且難以辨認的內容物和奇怪的角度等。

在Utilities > Captioning > WD14 Captioning（WD14標註）頁簽，配置以下參數。

參數	說明
Image folder to caption（要添加標註的影像檔夾）	選擇已建立的檔案夾。如果下拉式功能表中不顯示目標檔案夾，您可以手動輸入該檔案夾的路徑。例如，`/data-oss/datasets/test/30_test`。
Undesired Tags	輸入不想要的提示詞。
Prefix to add to WD14 caption	輸入想要的LoRA觸發詞，格式為資料集名稱+數字。例如，`test1`。

在Kohya（專享版）頁面，選擇LoRA（LoRA）> Training（訓練），完成以下配置。

在Source model（模型來源）頁簽，配置以下參數。

參數	說明
Model Quick Pick（快速選擇模型）	選擇custom。
Pretrained model name or path	單擊右側重新整理模型列表。在下拉式功能表選擇：/data-oss/models/Stable-diffusion。在該路徑後輸入`/`，繼續選擇已添加的模型。

在Parameters（參數）頁簽，配置以下參數。

參數	說明
Epoch（訓練周期數）	設定為20。
Max resolution（最大解析度）	設定為768,768。
Enable buckets（啟用資料容器buckets）	取消勾選。資料集檔案尺寸相同時取消勾選。
Text Encoder learning rate（文本編碼器學習率）	設定為0.00001。
Network Rank （Dimension）	設定為128。
Network Alpha	設定為64。

在文生圖頁簽，完成以下配置。

在Generation頁簽，配置以下參數。

參數

說明

迭代步數（Steps）

設定為30。

指令碼

選擇X/Y/Z plot。

在Lora頁簽，單擊重新整理，單擊已添加的LoRA模型。
如果找不到該LoRA模型，可選擇訓練的其中一個LoRA模型，並修改提示詞。
例如，將<lora:test-000002:1>修改為<lora:test-NUM:STRENGTH>。

填寫提示詞。

參數	說明
正向提示詞	`test1, outdoors, sky, day, cloud, water, tree, blue sky, no humans, traditional media, grass, building, nature, scenery, house, castle，`
反向提示詞	`lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit,fewer digits, cropped, worst quality, low quality,normal quality, jpeg artifacts, signature,watermark, username, blurry,(worst quality:1.4),(low quality:1.4), (monochrome:1.1), Eagetive,`