全部產品
Search
文件中心

AnalyticDB:分布式架構Ray

更新時間:Dec 05, 2025

在資料智能化時代,多模態資料(如文本、映像、音頻、視頻)的處理需求日益增長。AnalyticDB for MySQL推出AnalyticDB Ray,支援多模資料ETL與ML一體化,提升AI流水線效率,實現從資料到智能決策的無縫轉換。

什麼是AnalyticDB Ray

開源 Ray 是一款專為 AI 與高效能運算設計的分散式運算架構,通過簡潔的 API 抽象實現高效的分布式調度,使用者僅需幾行代碼,即可將單機任務擴充至千節點叢集,能夠像調用本地函數一樣調度遠端資源。其內建模組(如Ray Tune、Ray Train和Ray Serve)與TensorFlow、PyTorch等無縫相容。在活躍的開源社區和Anyscale等企業的推動下,Ray已成為構建 AI 應用的重要工具。

儘管開源 Ray 提供了高度靈活的分散式運算能力,但在實際生產環境中,企業仍面臨分布式作業最佳化、資源精細化調度、叢集營運複雜以及系統穩定性與高可用性保障等挑戰。

針對上述問題,AnalyticDB for MySQL推出全託管Ray服務——AnalyticDB Ray。AnalyticDB Ray基於開源Ray的豐富生態,通過多模態處理、具身智能、搜尋推薦、金融風控等典型情境的驗證,對Ray核心和服務能力進行了全面增強,最佳化了核心效能,簡化了叢集營運,並與AnalyticDB for MySQL湖倉平台無縫整合,助力企業構建Data+AI一體化架構,加速企業AI的規模化落地。

AnalyticDB Ray的優勢

  • 易用性

    • 自動建立RayCluster:控制台提供了一鍵部署的白屏化能力,使用者可建立AI類型的資源群組,完成Head和Worker資源規格配置後,即可建立RayCluster。

    • 內建大模型微調推理工具鏈:內建強化學習一鍵蒸餾、微調、推理、評測LLMs模型工具。

    • 內建具身智慧型工具鏈:AnalyticDB Ray作為Python生態的資源調度基礎,支援Cosmos、NeMo Curator、GROOT N1等,實現資料的模擬、合成及模型微調。

  • 生態整合

    • Lance:支援儲存多模態資料。

    • Llama-factory:支援在Ray平台上進行分布式微調。

    • Spark:通過Ray DP支援在Ray上運行Spark,實現資源的混合部署。

  • 性價比

    • 多租戶、多Job資源隔離:通過vCluster以及資源群組共用,解決租戶、Job之間資源隔離和共用問題。

    • Data+AI深度融合:AnalyticDB原生支援PB級資料存放區與分析,結合Ray實現了從資料處理、多模特徵工程到模型推理的全鏈路貫通。同時,Ray與AnalyticDB的即時分析負載及Spark的資源混合複用,顯著提升了資源使用率。

    • AutoScaling:根據負載自動進行GPU/CPU資源的彈性擴充與縮減,同時支援低成本的Spot資源。

    • 彈性緩衝:根據Ray的讀寫資料量和頻寬需求,靈活構建快取服務資源。

    • 資源精細化調度:自動依據節點的資源使用率進行調度,同時增加GPU多租戶超賣的隔離機制以及任務之間的親和性(Affinity)和反親和性(Anti-affinity)調度策略。

  • 穩定性和高可用性

    • 無感遷移與自愈:支援叢集的無感輪轉升級,節點異常情況下可實現自動回復。

    • 高可用性:支援主備Head節點配置。

  • 可觀測性

    監控指標看板:任務Dashboard的持久化以及多叢集的統一可觀測管理。