すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:実験管理

最終更新日:Jun 26, 2026

実験管理では、TensorBoard を使用して、複数のトレーニングタスクにわたる train_losstotal_flos などのメトリクスを可視化および比較できます。これにより、ファインチューニング時に最適なハイパーパラメータの組み合わせを選択できます。

前提条件

TensorBoard でメトリクスを可視化するには、まず OSS バケットを作成する必要があります。手順については、「コンソールでのバケットの作成」をご参照ください。

課金

  • 実験管理は無料でご利用いただけます。ただし、Model Gallery でモデルをトレーニングし、タスクを実験に関連付けると、DLC トレーニングおよび OSS ストレージの料金が発生します。詳細については、「DLC の課金」および「OSS の課金概要」をご参照ください。

  • TensorBoard インスタンスは 5 つまで無料でご利用いただけます。追加のインスタンスには料金が発生します。

トレーニングタスクと実験の関連付け

Model Gallery でモデルのファインチューニングタスクを作成する際、タスクを新規または既存の実験に関連付けることができます。手順は次のとおりです。

  1. 「モデル詳細」ページで、Train をクリックします。

  2. ファインチューニング詳細ページで、Experiment Configuration セクションで、実験の関連付けを設定します。

    1. タスクを新しい実験に関連付けるには、Create Experiment を選択し、Experiment NameExperiment Output Path を指定します。

      説明

      [Experiment Output Path] は、モデルや TensorBoard ログを含む、関連付けられたタスクからのすべての出力データのデフォルトパスを設定します。

      タスクの出力パスをカスタマイズするには、Output Data Configuration セクションで設定します。ただし、デフォルトの TensorBoard パスを変更すると、実験の TensorBoard インスタンスでのタスク間のメトリック比較ができなくなります。デフォルトのパスを維持することを推奨します。

    2. または、タスクをExisting Experimentsに関連付けます。

      ドロップダウンリストから特定の実験 (exp-bert など) を選択します。

  3. 残りのファインチューニングタスクのパラメータを設定します。詳細については、「モデルのデプロイとトレーニング」をご参照ください。

  4. Train をクリックします。

    ページは、関連付けられた実験名やハイパーパラメーターなどのタスクメタデータが表示されるTask details ページにリダイレクトされます。

実験の表示と TensorBoard の起動

TensorBoard を使用して、同じ実験に関連付けられたトレーニングタスクの train_losstotal_flos などのメトリクスを比較できます。手順は次のとおりです。

  1. モデルギャラリーホームページで、Job Management をクリックします。

  2. Job Management ページの All Experiments で、目的の実験を探し、TensorboardOperation 列でクリックします。

    TensorBoard インスタンスが自動的に起動します。

    [View Tensorboard] ダイアログボックスが表示され、インスタンスの [Name][Output Artifact URI][Status][URL] が表示されます。インスタンスの作成中は [Status][Creating] となり、[URL] はハイフン (-) で表示されます。インスタンスの作成後に URL が表示されます。ダイアログボックス下部の [Delete][Stop]、または [Close] ボタンを使用してインスタンスを管理できます。

  3. TensorBoard のステータスが In operation になったら、Go to をクリックします。TensorBoard インターフェイスが新しいブラウザータブで開きます。

    記録される具体的なメトリクスは、モデルによって異なります。

TensorBoard でのタスクメトリクスの比較

  1. [Horizontal Axis] でオプションを選択して、グラフの水平軸を変更してください。

    • [STEP]:トレーニングステップ番号。

    • [RELATIVE]:トレーニング開始からの経過時間 (時間単位)。例:0.5 時間。

    • [WALL]:絶対時刻。例:2024 年 4 月 2 日午前 10 時。

    一般的なメトリクス:

    • [loss]:モデルの予測値と正解データとの差。

    • [accuracy][precision][recall]:モデルパフォーマンスメトリクス。

  2. タスクのチェックボックスをオンまたはオフにして、比較に含めるか除外するかを選択してください。

  3. タスク間でメトリクス値が類似している場合、グラフ下部中央のボタンをクリックして、最も大きな差異がある領域を拡大表示してください。

  4. 一番左のボタンをクリックして、グラフを全画面で表示してください。