全部產品
Search
文件中心

Lindorm:使用自訂鏡像運行 RAY 作業

更新時間:Apr 29, 2026

本文檔將指導您如何基於 Lindorm Ray 提供的官方公用鏡像來構建和使用自訂鏡像。通過該功能,您可以將業務所需的依賴庫預先打包,從而實現運行環境的一致性、提升作業啟動效率,並滿足複雜情境下的個人化需求。

前提條件

在開始操作前,請確保您已滿足以下條件:

  • 已成功開通Lindorm 計算引擎。如果尚未開通,請參加服務開通

  • 已擁有一個與 Lindorm 執行個體同地區的ACR執行個體。如果尚未開通,請參見建立企業版執行個體

注意事項

在使用自訂鏡像時,請務必遵守以下規則,以確保系統穩定性和功能相容性:

  • 禁止修改核心目錄:在 Dockerfile 中,請勿修改以下目錄及其子目錄下的任何檔案:

    • /tmp/ray/

    • /opt/

    • Ray 的安裝目錄(例如,Python 3.11 版本的路徑為 /home/ray/anaconda3/lib/python3.11/site-packages/ray/)。

  • 同地區部署:自訂鏡像必須上傳至與 Lindorm 執行個體相同地區的 ACR 倉庫中,否則 Lindorm 將無法拉取。

核心流程

使用自訂鏡像主要遵循以下四個步驟:

  1. 準備與構建:基於 Lindorm Ray 官方公用鏡像,編寫 Dockerfile 並構建自訂鏡像。

  2. 上傳鏡像:將構建好的鏡像推送至您的阿里雲 ACR 倉庫。

  3. 授權訪問:在 Lindorm 控制台授權服務訪問您的 ACR 倉庫,此操作僅需一次。

  4. 配置與使用:在建立 Ray 資源群組時,通過“進階配置”指定您的自訂鏡像。


步驟一:準備與構建自訂鏡像

擷取 Lindorm Ray 公用鏡像地址

Lindorm 為您提供了預置 Ray 環境的公用鏡像,這是構建自訂鏡像的基礎。

  • 鏡像拉取地址模板:

    docker pull lindorm-compute-public-registry.cn-hangzhou.cr.aliyuncs.com/lindorm-ray/ray:[鏡像版本號碼]
  • 當前可用版本:

    鏡像版本號碼

    Python 版本

    是否支援 GPU

    2.50.1-1.1.1-py310-cpu

    Python 3.10

    2.50.1-1.1.1-py311-cpu

    Python 3.11

    2.50.1-1.1.1-py310-gpu

    Python 3.10

    是(預裝 CUDA)

    2.50.1-1.1.1-py311-gpu

    Python 3.11

    是(預裝 CUDA)

安裝依賴版本說明

為保證相容性,建議參考 RAY 官方依賴列表選擇預裝的依賴版本,比如使用pip install -c requirements_compiled.txt來安裝依賴。

編寫 Dockerfile

建立一個 Dockerfile 檔案,以 Lindorm Ray 公用鏡像為基礎,並添加您自己的依賴安裝命令。

樣本 Dockerfile

FROM lindorm-compute-public-registry.cn-hangzhou.cr.aliyuncs.com/lindorm-ray/ray:2.50.1-1.1.1-py311-cpu

RUN pip install --no-cache-dir numpy pandas
重要

請勿修改 /tmp/ray/、/opt/,以及 RAY 的安裝目錄及其子目錄下的檔案。以 Python 3.11 版本的 Lindorm RAY 鏡像為例,RAY 的安裝目錄為 /home/ray/anaconda3/lib/python3.11/site-packages/ray/。

構建鏡像

在 Dockerfile 所在的目錄下,執行以下命令構建鏡像。

docker build -t your-image-name:tag .

步驟二:上傳鏡像到阿里雲 ACR

構建完成後,您需要將本地鏡像推送至 ACR 倉庫。

登入 ACR

docker login --username=<your-username> <your-registry>

為鏡像打標籤並推送

docker tag your-image-name:tag <your-registry>/<namespace>/<repo>:tag
docker push <your-registry>/<namespace>/<repo>:tag

步驟三:授權 Lindorm 訪問 ACR

在建立 Ray 資源群組的頁面,您需要授權 Lindorm 服務訪問您的 ACR 鏡像倉庫。

  1. 點擊“免密訪問 ACR 自訂鏡像”。

  2. 在彈出的授權視窗中,確認授權。

說明

此授權操作僅需執行一次,後續建立資源群組時無需重複授權。


步驟四:在 Ray 資源群組中使用自訂鏡像

完成授權後,在建立 Ray 資源群組頁面的“進階配置”中,填入以下 JSON 配置來指定您的自訂鏡像。

{ 
"clusterConfig.image.custom.acr.instanceId":"your-acr-instanceId",
"clusterConfig.image":"your-full-image-addr"
}

配置項說明:

配置項

說明

樣本

clusterConfig.image.custom.acr.instanceId

您的 ACR 執行個體 ID。

"cri-123456789"

clusterConfig.image

完整的鏡像地址,格式為 <registry>/<namespace>/<repo>:<tag>

"your-registry-vpc.cn-hangzhou.cr.aliyuncs.com/my-namespace/my-ray-app:1.0"

完成配置後,即可建立使用自訂鏡像的 Ray 資源群組。