大規模言語モデル(LLM)アプリケーションに Python 用 ARMS エージェントをインストールすると、Application Real-Time Monitoring Service(ARMS)がアプリケーションのトレースデータを分析します。 アプリケーション詳細ページの トレース エクスプローラー タブで、LLM のトレースにおけるさまざまなタイプの期間の消費時間と、入力、出力、トークン消費などの期間情報を表示できます。
LLM トレースエクスプローラー機能は現在ベータテスト中です。 この機能を試してみたい場合は、DingTalk グループ(ID:67690017432)に参加してサポートを受けてください。
前提条件
LLM アプリケーションに ARMS エージェントがインストールされていること。
トレースデータのフィルタリング
ARMS コンソール にログインします。
左側のナビゲーションウィンドウで、 を選択します。
[トレースエクスプローラー] ページで、右上隅にあるクエリ対象の期間を設定します。
説明デフォルトでは、トレースエクスプローラーは
アイコンの [大規模モデルビュー] を使用します。 [マイクロサービスビュー] に切り替えるには、
アイコンをクリックします。トレースデータをフィルタリングします。
[クイックフィルター] セクションで、ステータス、期間、期間タイプ、インターフェース名、またはモデル名でトレースをフィルタリングします。
指定したフィルター条件は、ページ上部の検索ボックスに表示されます。
上部の検索ボックスをクリックします。 ドロップダウンダイアログボックスで、既存のフィルター条件を変更するか、新しいフィルター条件を追加します。

上部の検索ボックスにクエリ条件を直接入力します。 クエリ構文の詳細については、「トレースエクスプローラーの使用方法」をご参照ください。
説明検索ボックスの右側にある
アイコンをクリックして、現在のフィルター条件を保存します。検索ボックスの右側にある [保存済みビュー] をクリックして、保存済みのフィルター条件を表示します。 目的のフィルター条件をクリックして、その条件下でトレースデータをすばやく表示します。
集約ディメンションを選択して、フィルタリングされたデータをグループ化します。
トレースリスト
フィルター条件を設定すると、[トレースエクスプローラー] ページに、呼び出し回数、トークン、期間パーセンタイル、期間分布、トレースリストなどのフィルタリングされた LLM トレースデータが表示されます。

トレースリストには、トレース ID、入出力コンテンツ、インターフェース名、期間タイプ、期間、トークン数、アプリケーション名、ユーザー ID、セッション ID、開始時刻などの詳細が表示されます。 トレースリストでは、次の操作を実行できます。
目的のトレースを見つけて、[アクション] 列の [詳細] をクリックして、完全なトレース情報を表示します。 詳細については、「トレースの詳細」をご参照ください。
目的のトレースを見つけて、[アクション] 列の [ログ] をクリックして、ログを表示します。
右上隅にある
アイコンをクリックして、リストに表示されるフィールドをカスタマイズします。フィールドにカーソルを合わせて
アイコンをクリックすると、現在のフィールド値がフィルター条件として追加されます。
トレースの詳細
トレースをクリックした後に表示されるパネル、または [アクション] 列の [詳細] をクリックした後に表示されるパネルの [トレースの詳細] タブで、タイムライン、開始時刻、合計期間、および入出力コンテンツ、期間名、期間タイプ、期間、アプリケーション名、トークン数などの詳細を表示できます。

[トレースの詳細] タブでは、次の操作を実行できます。
トークンタグにカーソルを合わせると、詳細なトークンデータが表示されます。
期間名をクリックすると、その期間、開始時刻、追加情報、メトリック、ログが表示されます。 操作タイプによって表示される情報が異なる場合があります。
追加情報には、モデル名、入力の質問、プロンプトテンプレート、呼び出しパラメーター、戻り結果が含まれます。
[属性] フィールドの詳細については、「LLM アプリケーションのトレースフィールド」をご参照ください。
関連情報
その他のトレースエクスプローラー機能の詳細については、「トレースエクスプローラー」をご参照ください。