Container Service for Kubernetes (ACK) を使用すると、制御プレーンが高可用性で、ACKによって完全に管理されているACK Lingjunマネージドクラスターを作成できます。 ACK Lingjunマネージドクラスターは、PAI-Lingjun AI Computing Serviceに基づいて開発され、ワーカーノードとして機能するLingjun計算ノードを含みます。 このトピックでは、ACKを有効にしてLingjunクラスターを作成する方法について説明します。
前提条件
LingjunコンピュートノードとLingjun接続は、ビジネス要件に基づいて購入されます。 詳細については、「Lingjun AI Computing Serviceの有効化とリソースの購入」をご参照ください。
cloud Enterprise Network (CEN) 、Application Real-Time Monitoring Service (ARMS) 、Virtual Private Cloud (VPC) 、ACK Lingjunマネージドクラスターなどの関連クラウドサービスは、ビジネス要件に基づいて購入および構成されます。 詳細については、「その他のAlibaba Cloudサービスの有効化と設定」をご参照ください。
アカウントの実名認証は完了しており、アカウントの現金残高またはクレジット残高は少なくともCNY 100です。
背景情報
ACK Lingjunマネージドクラスタは、フルマネージドおよび高可用性制御プレーンを提供し、効率的な異種リソース管理および異種タスクスケジューリングをサポートする。 このタイプのクラスターは、AI向けMachine Learning Platformのクラウドネイティブベースとして使用でき、AIシナリオおよびハイパフォーマンスコンピューティング (HPC) シナリオに適した拡張クラウドネイティブ機能を提供します。 詳細については、「」をご参照ください。ACK Lingjunとは何ですか?
クラスターの作成と構成
Intelligent Computing Lingjunコンソールにログインします。
左側のナビゲーションウィンドウで、[リソースとノード]> [クラスター管理] を選択します。 [クラスター管理] ページが表示されます。
[クラスターの作成] をクリックして、[マネージドクラウドクラスターの作成] ページに移動します。
Lingjunクラスター (AI、ACK、およびCPFS用のMachine Learning Platformを含む) をクリックします。
[クラスターの作成] ウィザードで、[クラスターとグループ] 、[ACKを有効にしたLingjunクラスターの作成] 、[ソフトウェアインスタンスの基本パラメーター] 、[ソフトウェアインスタンスとグループ間の関係のマッピング] の手順で設定を完了します。
ACK Lingjun管理クラスターに対して個別に課金されます。 詳細については、「ACK Lingjunクラスターの課金」をご参照ください。
クラスターとノードグループの設定
ビジネス要件に基づいて複数のクラスターを計画し、クラスター内の計算ノードをノードグループに分割できます。 クラスターとコンピュートノードを計画することで、コンピュートノードのリソース使用率を向上させることができます。 クラスターと計算ノードを計画したら、このセクションで説明する手順を実行して、クラスターとノードグループを設定します。
クラスター情報を設定します。
クラスター名、クラスターノードのルートパスワード、リソースグループなどの情報を指定します。 リソースグループの作成方法の詳細については、「リソースグループの作成」をご参照ください。
[グループの作成] をクリックして、ノードグループを作成します。
[グループの作成] ダイアログボックスで、グループ名と、グループに属するノードに関する情報 (計画に基づくノードモデルやイメージなど) を指定します。
ノードインスタンスの横にある [ノードインスタンスの選択] をクリックして、グループに追加するノードを選択します。
保存をクリックして、次のステップに進みます。 ネットワーク設定
ソフトウェアインスタンスの基本パラメータの設定
基本パラメータを設定します。
ACK
ACK Lingjun管理クラスターのパラメーターを設定します。 パラメーターの詳細については、「ACK管理クラスターの作成」をご参照ください。
重要Service CIDRブロックと、ACK Lingjun管理クラスターのポッドCIDRブロック、パブリックCIDRブロック、およびVPC CIDRブロックは、互いに重複することはできません。
CPFS
Cloud Parallel File Storage (CPFS) ファイルシステムのパラメーターを設定します。
説明CPFSファイルシステムの作成後、CPFSコンソールでファイルシステムに関する情報を表示できます。
機械学習プラットフォームfor AI
Machine Learning Platform for AIのパラメーターを設定します。
説明ApsaraDB RDS、Apsara File Storage NASおよびCPFSファイルシステム、Container Registry、およびOAuth認証の設定方法の詳細については、「その他のAlibaba Cloudサービスの有効化と設定」をご参照ください。
[保存して次のステップ: ソフトウェアインスタンスとグループ間のリレーションシップのマッピング] をクリックします。
ソフトウェアインスタンスとノードグループ間のマッピングの設定
ACK Lingjunマネージドクラスターは、Lingjun計算ノードをデプロイできるLingjunノードプールを提供します。 これにより、Lingjunノードを効率的に管理できます。 たとえば、ノードの構成と管理、指定されたノードへのアプリケーションのスケジュール、ノードプールに基づくGPUの構成などができます。 ノードプールの詳細については、「Lingjunノードプールの概要」をご参照ください。
[ノードプールの作成] をクリックします。
ノードプールの名前や最大ノード数など、ACKノードプールに関する情報を設定します。
[関連グループの選択] をクリックします。 表示されるダイアログボックスで、ノードプールを関連付けるノードグループを選択し、[OK] をクリックします。
[保存して次のステップ: 設定の確認] をクリックします。
設定の確認
[構成の確認] ステップで、基本的なクラスター情報、ネットワーク構成、ソフトウェアインスタンスとノードグループ間のマッピング、およびソフトウェアインスタンスのパラメーターを確認します。 設定が正しい場合は、[設定の送信] をクリックしてクラスターを作成します。
[依存関係チェック] セクションの [完全な承認] をクリックして、ACKの承認を完了します。