Distributed Cloud Container Platform for Kubernetes (ACK One) は、オンプレミスデータセンター、サードパーティクラウド、または Alibaba Cloud リージョンなど、実行場所に関わらず Kubernetes クラスターを接続、管理、運用できるエンタープライズクラスのクラウドネイティブプラットフォームです。ACK One は、オープンソース Kubernetes と互換性のある API を提供し、コンピューティング、ネットワーク、ストレージ、セキュリティ、可観測性、ジョブ、アプリケーション、およびトラフィック管理を、ご利用のすべてのクラスターにわたってカバーします。
クラスタータイプ
ACK One は、以下の 3 つのクラスタータイプを中心に機能を提供します。
| クラスタータイプ | 概要 |
|---|---|
| 登録済みクラスター | オンプレミスまたはサードパーティクラウド上の任意の外部 Kubernetes クラスターで、一元管理と Alibaba Cloud 統合のために ACK コンソールに接続されます。 |
| マルチクラスターフリートインスタンス | 複数の Kubernetes クラスターをグループ化し、アプリケーションの協調的な分散、トラフィック管理、モニタリングを可能にする統合コントロールプレーン。 |
| 分散型 Argo Workflows 用 Kubernetes クラスター | Elastic Container Instance (ECI) 上に構築されたサーバーレスクラスターで、大規模な Argo Workflows を費用対効果が高くイベント駆動型で実行します。 |
機能
クラスターの一元管理
-
任意のプロバイダーまたは場所からクラスターを単一のコンソールと API サーフェスに接続します。
-
すべてのクラスターにわたって、セキュリティポリシー、アクセスの制御、構成検査を一元的に適用します。
-
すべてのクラスターのヘルスとコストのメトリックを、1 つのグローバルモニタリングダッシュボードで表示します。
リソースのオンデマンドスケーリング
-
外部 Kubernetes クラスターに Elastic Compute Service (ECS) インスタンスまたは ECI を追加することで、オンプレミスクラスターから Alibaba Cloud へワークロードをバーストします。
-
ACK スケジューラを使用して、ギャングスケジューリング、トポロジー認識型 CPU スケジューリング、ECI ベースのスケジューリングなどの高度なスケジューリングを行います。
-
コンピューティングとストレージが分離された環境で ACK Fluid 分散キャッシュを使用して、データアクセスを高速化し、帯域幅使用量を削減します。
-
クラウドリソースを自動的にスケーリングしてトラフィックの変動に対応するか、スケジュールされたスケーリングを設定して費用対効果を向上させます。
アプリケーションの保護と回復
-
Backup center を使用して、リージョン間またはデータセンターからクラウドへアプリケーションとデータをバックアップおよび復元します。これは追加設定なしですぐに利用できます。
-
自動バックアップポリシーと復元ポリシーを設定して、アプリケーションを継続的に保護します。
-
業務継続性のために、2つのゾーンにある3つのデータセンターにわたってアクティブ地理的冗長性を構築します。
複数のクラスターへのアプリケーションの分散
-
ACK One でオープンソース ArgoCD をホストし、GitOps を介してマルチクラスターアプリケーションを分散します。
-
同じ Git リポジトリからデプロイしながら、クラスターごとに異なる構成を適用します。
-
スケジュールに基づいて複数のクラスターでジョブを実行します。
フリートレベルでのトラフィック管理
-
Microservices Engine (MSE) クラウドネイティブゲートウェイを使用して、クラスター間で南北のトラフィックをルーティングします。
-
東西のトラフィックを管理するためにマルチクラスターサービスを作成します。
-
重みと Pod レプリカ数に基づいてレイヤー 7 ルーティングルールを持つグローバル Ingress を構成し、自動フェイルバックを有効にします。
AI およびビッグデータワークロードの実行
-
Kubernetes クラスターに Alibaba Cloud によって検証された多数のエンタープライズクラスのプロダクトまたはコンポーネントを迅速にデプロイし、セキュリティを強化し、スケジューリング効率を向上させ、AI およびビッグデータコンピューティングを高速化します。
-
統合インターフェイスから AI トレーニングジョブ、リソースクォータ、および可観測性を管理します。
-
GPU 共有により、GPU 使用率を約 300% 向上させます。
-
Spark、Kubernetes、および TensorFlow ジョブのコンピューティングとストレージのデカップリングおよびクラスター間スケジューリングにより、分散トレーニングを高速化します。
-
ECS Bare Metal Instance でインテリジェントな CPU スケジューリングと非均一メモリアクセス (NUMA) アウェアネスを有効にします。
大規模ワークフローの費用対効果の高い実行
-
データプレーンの使用量のみを支払います。Argo Workflows コントロールプレーンは無料です。
-
プリエンプティブインスタンスを使用して、コンピューティングコストをさらに削減します。
-
数千の同時ワークフローと数万の並行計算タスクを処理します。
-
Git、Message Service (MNS)、または Object Storage Service (OSS) イベントからワークフローを自動的にトリガーします。
-
リージョン間分散キャッシュにより、20 Gbit/s を超える集約読み取り帯域幅を実現します。
ユースケース
オンプレミスクラスターの接続とクラウドへのスケーリング
オンプレミスクラスターを登録して、ご利用のデータセンターを Alibaba Cloud に接続します。トラフィックピーク時、ACK One はリソースとアプリケーションをクラウドにスケーリングしてロードを分散するため、ご利用のオンプレミスインフラストラクチャはベースライン需要のみを処理します。
Alibaba Cloud サービスによるオンプレミスクラスターの拡張
データセンターまたはサードパーティクラウドにデプロイされたクラスターに、Alibaba Cloud の可観測性、セキュリティ、マイクロサービスガバナンス機能をもたらします。
-
可観測性:環境全体で一貫した O&M エクスペリエンスでログ、モニタリングデータ、イベントを収集します。
-
セキュリティ:監査、セキュリティ検査、ノードリスク検出、およびポリシーガバナンスを有効にします。
-
マイクロサービスガバナンス:Service Mesh (ASM) と Microservices Engine (MSE) を使用して、トラフィックコントロールとサービスガバナンスを行います。
ハイブリッドクラウド、リージョン、またはゾーン間でのディザスタリカバリの実装
-
リージョン間またはオンプレミスからクラウドへ、ステートフルアプリケーションとデータをバックアップします。
-
自動バックアップをスケジュールし、リカバリ目標を達成するために復元ポリシーを定義します。
-
Kubernetes ネイティブな業務継続性のために、2つのゾーンにある3つのデータセンターにわたってアクティブ地理的冗長性アーキテクチャを構築します。
AI およびビッグデータワークロードの高速化
-
[AI アルゴリズム開発]:1 つのコンソールから AI ジョブ、クォータ、および可観測性を管理します。
-
[AI トレーニング]:Spark、Kubernetes、および TensorFlow ジョブのトポロジー認識型スケジューリング、コンピューティングとストレージのデカップリング、およびクラスター間スケジューリングを使用します。
-
[AI 推論]:GPU 共有により GPU 使用率を約 300% 向上させ、クラウドとオンプレミスリソース間でのオートスケーリングを行います。
-
[インテリジェントな CPU スケジューリング]:ECS Bare Metal Instance で高遅延感度ジョブの NUMA 認識型ワークロードを実行します。
GitOps による複数のクラスターへのアプリケーションの分散
ホスト型 ArgoCD を備えたマルチクラスターフリートインスタンスを使用して、Git リポジトリから複数のクラスターにアプリケーションを同時にデプロイします。
-
開発者は Git リポジトリの権限のみを必要とし、直接的な Kubernetes クラスターアクセスは不要です。
-
すべてのデプロイメントにバージョン管理、変更承認、コードロールバック、および監査ログを適用します。
-
クラスター内のアプリケーションを、Git で宣言された状態と継続的に同期させます。
-
異なる構成を持つ同じアプリケーションを異なるクラスターにデプロイします。
マルチクラスターゲートウェイによるゾーンディザスタリカバリの実装
クラスター間でトラフィックをインテリジェントにルーティングして、コストを削減し、回復性を向上させます。
-
マルチクラスターゲートウェイを使用して、可用性とコストに基づいて南北のトラフィックをスケジュールします。
-
重みと Pod レプリカ数によって制御されるレイヤー 7 ルーティングルールを持つグローバル Ingress を作成し、クラスターが利用不可になった場合は自動フェイルバックを行います。
Argo Workflows を使用した大規模ジョブと複雑なワークフローのオーケストレーション
マネージドサーバーレス Argo Workflows コントロールプレーンで、シミュレーション、科学計算、データ処理、および継続的インテグレーションワークロードを実行します。
-
複数のリージョンとゾーンにわたってリソースを使用します。
-
プリエンプティブインスタンスと従量課金制のデータプレーン課金により、コストを削減します。
-
分散キャッシュを使用してコンピューティングとストレージをデカップリングし、ジョブの実行を高速化します。
次のステップ
お問い合わせ
ACK One に関するご質問がある場合は、DingTalk グループ 35688562 にご参加ください。