Fluid JindoRuntime FUSE クライアントのモニタリングを有効にして使用します。
Fluid は、ご利用の ACK クラスター内の各 JindoCache 分散キャッシュエンジンから監視メトリクスを収集する、すぐに使える JindoRuntime ダッシュボードを提供します。このダッシュボードは、サーバー側キャッシュエンジンメトリックとユーザー空間ファイルシステム (FUSE) クライアントメトリックの 2 つのメトリックカテゴリをカバーしています。パフォーマンス上の理由から、FUSE クライアントメトリックはデフォルトでは公開されていないため、明示的に有効にするまでダッシュボードには表示されません。
このトピックでは、FUSE クライアントメトリックのコレクションを有効にし、Fluid JindoRuntime ダッシュボードでデータを表示する方法について説明します。以下の 3 つのステップを完了すると、FUSE クライアントメトリックはダッシュボードの専用セクションに表示されます。MountPod モードの場合は FUSE メトリック (CSI 経由)、Sidecar モードの場合は FUSE メトリック (Sidecar 経由) です。
前提条件
開始する前に、以下を準備してください。
-
ご利用の ACK クラスターまたは ACK Serverless クラスターで Managed Service for Prometheus が有効になっていること。詳細については、「Managed Service for Prometheus の使用」をご参照ください。
-
ご利用のクラスターにクラウドネイティブ AI スイートと ack-fluid バージョン 1.0.11 以降がインストールされていること。詳細については、「クラウドネイティブ AI スイートのデプロイ」をご参照ください。
オープンソース Fluid がインストールされている場合は、競合を防ぐために ack-fluid をインストールする前にアンインストールしてください。
ステップ 1: Fluid と ARMS の統合
-
ARMS コンソールにログインします。
-
左側のナビゲーションウィンドウで [インテグレーションセンター] をクリックし、[AI] セクションで [Fluid] カードをクリックします。
-
[Kubernetes クラスターの選択]セクションで、クラスターを選択します。ページに Fluid がすでにインストール済みと表示される場合は、このセクションの残りのステップをスキップしてください。
-
[設定情報] セクションで、次のパラメーターを設定し、[OK] をクリックします。
パラメーター 説明 名前 (必須ではありません) Fluid エクスポーターの一意の名前。必要ない場合は空白のままにします。 メトリック収集間隔 (秒) サービスがモニタリングデータを収集する間隔。 -
統合を確認するには、ARMS コンソールの[統合管理] ページに移動します。
-
ARMS コンソールにログインします。
-
左側のナビゲーションウィンドウで、[統合管理] をクリックします。[統合アドオン] タブで、[Fluid] カードをクリックします。
-
[環境] タブで、[操作] 列の [詳細を表示] をクリックして、クラスター内の Fluid コンポーネントのステータスとアラートルールを表示します。
-
ステップ 2: メトリックの公開とスクレイピングポリシーの構成
JindoRuntime をデプロイする際、spec.fuse.metrics.enabled および spec.fuse.metrics.scrapeTarget フィールドを使用して、FUSE クライアントメトリックの公開を有効にし、スクレイピングポリシーを設定します。
YAML を記述する前にスクレイピングポリシーを選択してください。 scrapeTarget の値は、どのダッシュボードセクションにデータが入力されるかを決定します。
-
ワークロードが MountPod マウントモードを使用する非サーバーレス環境で実行される場合は、
MountPodを使用します。 -
ワークロードが Sidecar マウントモードを使用するサーバーレス環境で実行される場合は、
Sidecarを使用します。 -
両方のマウントモードからスクレイプするには、
Allを使用します。 -
FUSE クライアントメトリックのスクレイピングを無効にするには、
None(デフォルト) を使用します。
サーバーレス環境で scrapeTarget を Sidecar または All に設定する場合は注意してください。Sidecar マウントモードでは、各 Pod が FUSE サイドカーコンテナを起動します。同時実行 Pod の数が多い場合、すべての FUSE サイドカーコンテナからメトリックをスクレイプすると、かなりのオーバーヘッドが発生し、Managed Service for Prometheus インスタンスに大きな負荷がかかる可能性があります。
以下は、scrapeTarget: All の例を示す YAML です。
apiVersion: data.fluid.io/v1alpha1
kind: JindoRuntime
metadata:
name: hadoop
spec:
replicas: 2
fuse:
metrics:
enabled: true
scrapeTarget: All
tieredstore:
levels:
- mediumtype: MEM
path: /dev/shm
volumeType: emptyDir
quota: 2Gi
high: "0.99"
low: "0.95"
次の表は、メトリック関連の 2 つのパラメーターについて説明しています。
| パラメーター | 説明 | デフォルト値 |
|---|---|---|
spec.fuse.metrics.enabled |
FUSE クライアントメトリックを公開するかどうか。ポートが spec.fuse.args (例: -ometrics_port=8080) 経由で指定されていない状態で true に設定すると、Fluid は FUSE クライアントに利用可能なポートを自動的に割り当て、外部メトリックサービス用に構成します。 |
false |
spec.fuse.metrics.scrapeTarget |
FUSE クライアントメトリックのスクレイピングポリシー。サポートされている値: None、MountPod、Sidecar、All。各値を使用するタイミングについては、上記の決定ガイダンスをご参照ください。 |
None |
JindoRuntime パラメーターの完全なリストについては、「JindoFS を使用した OSS へのアクセス高速化」をご参照ください。
ステップ 3: Fluid JindoRuntime ダッシュボードの表示
-
「ACK コンソール」にログインします。左側のナビゲーションウィンドウで、[クラスター] をクリックします。
-
[クラスター] ページで、クラスターの名前をクリックします。左側ペインで、[操作] > [Prometheus モニタリング] を選択します。
-
[Prometheus モニタリング] ページで、[その他] タブをクリックし、次に [Fluid JindoRuntime ダッシュボード] タブをクリックします。このダッシュボードでは、
scrapeTarget構成に応じて、以下のセクションに FUSE クライアントのメトリックが表示されます:-
FUSE メトリック (CSI 経由): FUSE Pod クライアントからのメトリックを表示します。
scrapeTargetがMountPodまたはAllに設定されている場合にデータが入力されます。 -
FUSE メトリック (Sidecar 経由): FUSE サイドカーコンテナクライアントからのメトリックを表示します。
scrapeTargetがSidecarまたはAllに設定されている場合にデータが入力されます。
-