すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:ACKを有効にしてLingjunクラスターを作成する

最終更新日:Jul 22, 2024

Container Service for Kubernetes (ACK) を使用すると、制御プレーンが高可用性で、ACKによって完全に管理されているACK Lingjunマネージドクラスターを作成できます。 ACK Lingjunマネージドクラスターは、PAI-Lingjun AI Computing Serviceに基づいて開発され、ワーカーノードとして機能するLingjun計算ノードを含みます。 このトピックでは、ACKを有効にしてLingjunクラスターを作成する方法について説明します。

前提条件

  • LingjunコンピュートノードLingjun接続は、ビジネス要件に基づいて購入されます。 詳細については、「Lingjun AI Computing Serviceの有効化とリソースの購入」をご参照ください。

  • cloud Enterprise Network (CEN) 、Application Real-Time Monitoring Service (ARMS) 、Virtual Private Cloud (VPC) 、ACK Lingjunマネージドクラスターなどの関連クラウドサービスは、ビジネス要件に基づいて購入および構成されます。 詳細については、「その他のAlibaba Cloudサービスの有効化と設定」をご参照ください。

  • アカウントの実名認証は完了しており、アカウントの現金残高またはクレジット残高は少なくともCNY 100です。

背景情報

ACK Lingjunマネージドクラスタは、フルマネージドおよび高可用性制御プレーンを提供し、効率的な異種リソース管理および異種タスクスケジューリングをサポートする。 このタイプのクラスターは、AI向けMachine Learning Platformのクラウドネイティブベースとして使用でき、AIシナリオおよびハイパフォーマンスコンピューティング (HPC) シナリオに適した拡張クラウドネイティブ機能を提供します。 詳細については、「」をご参照ください。ACK Lingjunとは何ですか?

クラスターの作成と構成

  1. Intelligent Computing Lingjunコンソールにログインします。

  2. 左側のナビゲーションウィンドウで、[リソースとノード]> [クラスター管理] を選択します。 [クラスター管理] ページが表示されます。

  3. [クラスターの作成] をクリックして、[マネージドクラウドクラスターの作成] ページに移動します。

  4. Lingjunクラスター (AI、ACK、およびCPFS用のMachine Learning Platformを含む) をクリックします。

    [クラスターの作成] ウィザードで、[クラスターとグループ][ACKを有効にしたLingjunクラスターの作成][ソフトウェアインスタンスの基本パラメーター][ソフトウェアインスタンスとグループ間の関係のマッピング] の手順で設定を完了します。

説明

ACK Lingjun管理クラスターに対して個別に課金されます。 詳細については、「ACK Lingjunクラスターの課金」をご参照ください。

クラスターとノードグループの設定

ビジネス要件に基づいて複数のクラスターを計画し、クラスター内の計算ノードをノードグループに分割できます。 クラスターとコンピュートノードを計画することで、コンピュートノードのリソース使用率を向上させることができます。 クラスターと計算ノードを計画したら、このセクションで説明する手順を実行して、クラスターとノードグループを設定します。

image
  1. クラスター情報を設定します。

    クラスター名、クラスターノードのルートパスワード、リソースグループなどの情報を指定します。 リソースグループの作成方法の詳細については、「リソースグループの作成」をご参照ください。

  2. [グループの作成] をクリックして、ノードグループを作成します。

    1. [グループの作成] ダイアログボックスで、グループ名と、グループに属するノードに関する情報 (計画に基づくノードモデルやイメージなど) を指定します。

    2. ノードインスタンスの横にある [ノードインスタンスの選択] をクリックして、グループに追加するノードを選択します。

  3. 保存をクリックして、次のステップに進みます。 ネットワーク設定

ソフトウェアインスタンスの基本パラメータの設定

  1. 基本パラメータを設定します。

    ACK

    ACK Lingjun管理クラスターのパラメーターを設定します。 パラメーターの詳細については、「ACK管理クラスターの作成」をご参照ください。

    重要

    Service CIDRブロックと、ACK Lingjun管理クラスターのポッドCIDRブロック、パブリックCIDRブロック、およびVPC CIDRブロックは、互いに重複することはできません。

    CPFS

    Cloud Parallel File Storage (CPFS) ファイルシステムのパラメーターを設定します。

    説明

    CPFSファイルシステムの作成後、CPFSコンソールでファイルシステムに関する情報を表示できます。

    機械学習プラットフォームfor AI

    Machine Learning Platform for AIのパラメーターを設定します。

    説明

    ApsaraDB RDS、Apsara File Storage NASおよびCPFSファイルシステム、Container Registry、およびOAuth認証の設定方法の詳細については、「その他のAlibaba Cloudサービスの有効化と設定」をご参照ください。

  2. [保存して次のステップ: ソフトウェアインスタンスとグループ間のリレーションシップのマッピング] をクリックします。

ソフトウェアインスタンスとノードグループ間のマッピングの設定

ACK Lingjunマネージドクラスターは、Lingjun計算ノードをデプロイできるLingjunノードプールを提供します。 これにより、Lingjunノードを効率的に管理できます。 たとえば、ノードの構成と管理、指定されたノードへのアプリケーションのスケジュール、ノードプールに基づくGPUの構成などができます。 ノードプールの詳細については、「Lingjunノードプールの概要」をご参照ください。

  1. [ノードプールの作成] をクリックします。

  2. ノードプールの名前や最大ノード数など、ACKノードプールに関する情報を設定します。

  3. [関連グループの選択] をクリックします。 表示されるダイアログボックスで、ノードプールを関連付けるノードグループを選択し、[OK] をクリックします。

  4. [保存して次のステップ: 設定の確認] をクリックします。

設定の確認

  1. [構成の確認] ステップで、基本的なクラスター情報、ネットワーク構成、ソフトウェアインスタンスとノードグループ間のマッピング、およびソフトウェアインスタンスのパラメーターを確認します。 設定が正しい場合は、[設定の送信] をクリックしてクラスターを作成します。

  2. [依存関係チェック] セクションの [完全な承認] をクリックして、ACKの承認を完了します。