すべてのプロダクト
Search
ドキュメントセンター

Container Service for Kubernetes:トポロジー対応 GPU スケジューリングコンポーネントのインストール

最終更新日:Mar 04, 2026

ACK クラスターに ack-ai-installer コンポーネントをインストールして、トポロジー対応 GPU スケジューリングを有効にします。この機能は、GPU デバイスの物理トポロジーに基づいて、最適なトレーニング速度を提供するノード上の GPU の組み合わせを選択します。

事前準備

開始する前に、次の要件が満たされていることを確認してください。

バージョン要件

コンポーネント必須バージョン
Kubernetes1.18.8 以降
NVIDIA ドライバー418.87.01 以降
NVIDIA Collective Communications Library (NCCL)2.7 以降
GPUV100

サポートされているオペレーティングシステム

  • CentOS 7.6、CentOS 7.7

  • Ubuntu 16.04、Ubuntu 18.04

  • Alibaba Cloud Linux 2、Alibaba Cloud Linux 3

Cloud-native AI Suite からのコンポーネントのインストール

  1. ACK コンソールにログインします。左側のナビゲーションウィンドウで、クラスター をクリックします。

  2. クラスター ページで、対象のクラスターを見つけてその名前をクリックします。

  3. 左側のナビゲーションウィンドウで、アプリケーション > Cloud-native AI Suite を選択します。

  4. Cloud-native AI Suite ページで、デプロイ をクリックします。

  5. [スケジューリング] セクションで、[スケジューリングポリシー拡張(バッチタスクのスケジューリング、GPU共有、トポロジー対応GPUスケジューリング)] を選択し、[Cloud-native AI スイートのデプロイ] をクリックします。パラメーターの詳細については、「Cloud-native AI スイートのインストール」をご参照ください。

  6. Cloud-native AI Suite ページの コンポーネント リストに ack-ai-installer が表示されていることを確認します。

注: Cloud-native AI Suite のコンポーネントをすでにインストールしている場合は、コンポーネント リストで ack-ai-installer操作 列の デプロイ をクリックします。

次のステップ

コンポーネントをインストールした後、ワークロード向けにトポロジーを意識した GPU スケジューリングポリシーを設定します。詳細については、「GPU トポロジーを意識したスケジューリング」をご参照ください。