本文檔將指導您如何基於 Lindorm Ray 提供的官方公用鏡像來構建和使用自訂鏡像。通過該功能,您可以將業務所需的依賴庫預先打包,從而實現運行環境的一致性、提升作業啟動效率,並滿足複雜情境下的個人化需求。
前提條件
在開始操作前,請確保您已滿足以下條件:
注意事項
在使用自訂鏡像時,請務必遵守以下規則,以確保系統穩定性和功能相容性:
禁止修改核心目錄:在
Dockerfile中,請勿修改以下目錄及其子目錄下的任何檔案:/tmp/ray//opt/Ray 的安裝目錄(例如,Python 3.11 版本的路徑為
/home/ray/anaconda3/lib/python3.11/site-packages/ray/)。
同地區部署:自訂鏡像必須上傳至與 Lindorm 執行個體相同地區的 ACR 倉庫中,否則 Lindorm 將無法拉取。
核心流程
使用自訂鏡像主要遵循以下四個步驟:
準備與構建:基於 Lindorm Ray 官方公用鏡像,編寫
Dockerfile並構建自訂鏡像。上傳鏡像:將構建好的鏡像推送至您的阿里雲 ACR 倉庫。
授權訪問:在 Lindorm 控制台授權服務訪問您的 ACR 倉庫,此操作僅需一次。
配置與使用:在建立 Ray 資源群組時,通過“進階配置”指定您的自訂鏡像。
步驟一:準備與構建自訂鏡像
擷取 Lindorm Ray 公用鏡像地址
Lindorm 為您提供了預置 Ray 環境的公用鏡像,這是構建自訂鏡像的基礎。
鏡像拉取地址模板:
docker pull lindorm-compute-public-registry.cn-hangzhou.cr.aliyuncs.com/lindorm-ray/ray:[鏡像版本號碼]當前可用版本:
鏡像版本號碼
Python 版本
是否支援 GPU
2.50.1-1.1.1-py310-cpuPython 3.10
否
2.50.1-1.1.1-py311-cpuPython 3.11
否
2.50.1-1.1.1-py310-gpuPython 3.10
是(預裝 CUDA)
2.50.1-1.1.1-py311-gpuPython 3.11
是(預裝 CUDA)
安裝依賴版本說明
為保證相容性,建議參考 RAY 官方依賴列表選擇預裝的依賴版本,比如使用pip install -c requirements_compiled.txt來安裝依賴。
編寫 Dockerfile
建立一個 Dockerfile 檔案,以 Lindorm Ray 公用鏡像為基礎,並添加您自己的依賴安裝命令。
樣本 Dockerfile:
FROM lindorm-compute-public-registry.cn-hangzhou.cr.aliyuncs.com/lindorm-ray/ray:2.50.1-1.1.1-py311-cpu
RUN pip install --no-cache-dir numpy pandas請勿修改 /tmp/ray/、/opt/,以及 RAY 的安裝目錄及其子目錄下的檔案。以 Python 3.11 版本的 Lindorm RAY 鏡像為例,RAY 的安裝目錄為 /home/ray/anaconda3/lib/python3.11/site-packages/ray/。
構建鏡像
在 Dockerfile 所在的目錄下,執行以下命令構建鏡像。
docker build -t your-image-name:tag .步驟二:上傳鏡像到阿里雲 ACR
構建完成後,您需要將本地鏡像推送至 ACR 倉庫。
登入 ACR
docker login --username=<your-username> <your-registry>為鏡像打標籤並推送
docker tag your-image-name:tag <your-registry>/<namespace>/<repo>:tag
docker push <your-registry>/<namespace>/<repo>:tag步驟三:授權 Lindorm 訪問 ACR
在建立 Ray 資源群組的頁面,您需要授權 Lindorm 服務訪問您的 ACR 鏡像倉庫。
點擊“免密訪問 ACR 自訂鏡像”。
在彈出的授權視窗中,確認授權。
此授權操作僅需執行一次,後續建立資源群組時無需重複授權。
步驟四:在 Ray 資源群組中使用自訂鏡像
完成授權後,在建立 Ray 資源群組頁面的“進階配置”中,填入以下 JSON 配置來指定您的自訂鏡像。
{
"clusterConfig.image.custom.acr.instanceId":"your-acr-instanceId",
"clusterConfig.image":"your-full-image-addr"
}配置項說明:
配置項 | 說明 | 樣本 |
| 您的 ACR 執行個體 ID。 |
|
| 完整的鏡像地址,格式為 |
|
完成配置後,即可建立使用自訂鏡像的 Ray 資源群組。