すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:DeepSeek-R1 蒸留モデルのファインチューニング

最終更新日:Mar 27, 2026

DeepSeek-R1 は、DeepSeek 社が開発した、数学、コーディング、推論タスクに優れたモデルです。このトピックでは、DeepSeek-R1-Distill-Qwen-7B 蒸留モデルを例に、このシリーズのモデルをファインチューニングする方法について説明します。

サポートされるモデル

モデルギャラリーでは、6 種類の蒸留モデルに対する LoRA 教師ありファインチューニング (SFT) をサポートしています。次の表は、デフォルトのハイパーパラメーターと提供されたデータセットを使用する場合に推奨される最小コンピューティングリソース構成を示しています。

蒸留モデル

ベースモデル

サポートされるトレーニング手法

最小構成

DeepSeek-R1-Distill-Qwen-1.5B

Qwen2.5-Math-1.5B

LoRA 教師ありファインチューニング

1 × A10 (24 GB ビデオメモリ)

DeepSeek-R1-Distill-Qwen-7B

Qwen2.5-Math-7B

1 × A10 (24 GB ビデオメモリ)

DeepSeek-R1-Distill-Llama-8B

Llama-3.1-8B

1 × A10 (24 GB ビデオメモリ)

DeepSeek-R1-Distill-Qwen-14B

Qwen2.5-14B

1 × GU8IS (48 GB ビデオメモリ)

DeepSeek-R1-Distill-Qwen-32B

Qwen2.5-32B

2 × GU8IS (48 GB ビデオメモリ)

DeepSeek-R1-Distill-Llama-70B

Llama-3.3-70B-Instruct

8 × GU100 (80 GB ビデオメモリ)

クイックスタート

  1. モデルギャラリーページに移動します。

    1. Platform for AI (PAI) コンソールにログインします。左側のナビゲーションウィンドウで、対象の Workspace を選択します。

    2. 左側のナビゲーションウィンドウで、QuickStart > [モデルギャラリー] を選択します。

      image

  2. モデルギャラリーページで、DeepSeek-R1-Distill-Qwen-7B モデルカードを検索してクリックし、モデル詳細ページを開きます。このページには、SFT に必要なデータ形式やモデルの呼び出しメソッドなど、モデルのトレーニングとデプロイに関する詳細が記載されています。

    image

  3. 右上隅にある Train をクリックします。次の主要なパラメーターを設定します。

    • Dataset configuration:この例では、デフォルトのデータセットを使用します。モデル詳細ページの形式要件に従ってカスタムデータセットを準備し、それを Object Storage Service (OSS) バケットにアップロードすることもできます。

    • Model output path:ファインチューニングされたモデルを保存する OSS パスを選択します。

    • Computing ResourcesSource[パブリックリソース] を選択します。[インスタンスタイプ]ecs.gn7i-c16g1.4xlarge を選択します。

    • [ハイパーパラメーター]: 次の表では、LoRA 教師ありファインチューニングでサポートされるハイパーパラメーターについて説明します。必要に応じて調整できます。詳細については、「大規模言語モデル向けファインチューニングガイド」をご参照ください。

      ハイパーパラメーター

      パラメーター

      タイプ

      デフォルト (7B モデルの場合)

      説明

      learning_rate

      float

      5e-6

      学習率。モデルの重み調整の大きさを制御します。

      num_train_epochs

      int

      6

      訓練データセットを反復処理する回数。

      per_device_train_batch_size

      int

      2

      1 回のトレーニング反復で各 GPU が処理するサンプル数。バッチサイズを大きくすると効率が向上しますが、ビデオメモリの要件も増加します。

      gradient_accumulation_steps

      int

      2

      勾配累積ステップ数。

      max_length

      int

      1024

      1 回のトレーニング反復でモデルが処理する入力データの最大トークン長。

      lora_rank

      int

      8

      LoRA ディメンション。

      lora_alpha

      int

      16

      LoRA スケーリング係数。

      lora_dropout

      float

      0

      LoRA トレーニングのドロップアウト率。トレーニング中にニューロンをランダムにドロップすることで、過学習を防ぎます。

      lorap_lr_ratio

      float

      16

      LoRA+ の学習率比 (λ = ηB/ηA)。ここで、ηA と ηB はそれぞれアダプター行列 A と B の学習率です。LoRA と比較して、LoRA+ はアダプター行列 A と B に異なる学習率を使用することで、計算要件を増やすことなく、より良いパフォーマンスと高速なファインチューニングを実現します。標準の LoRA を使用する場合は、lorap_lr_ratio を 0 に設定します。

  4. Train をクリックします。PAI は自動的にトレーニングジョブページにリダイレクトし、そこでジョブのステータスをモニターしたり、ログを表示したりできます。

    image

    トレーニングジョブが成功すると、システムはファインチューニングされたモデルを [AI アセット管理 - モデル] に自動的に登録します。その後、モデルを表示またはデプロイできます。詳細については、「モデルの登録と管理」をご参照ください。

  5. トレーニングが完了したら、右上隅の Deploy をクリックして、ファインチューニングされたモデルを Elastic Algorithm Service (EAS) サービスとしてデプロイします。呼び出し方法は、元の蒸留モデルと同じです。詳細については、モデル詳細ページまたは「DeepSeek-V3 および DeepSeek-R1 モデルのデプロイ」をご参照ください。

    image

課金

モデルギャラリーでのモデルトレーニングには Data Science and AI (DLC) が使用されます。DLC はトレーニングジョブの持続時間に基づいて課金されます。詳細については、「DLC の課金」をご参照ください。

よくある質問

Q:トレーニングジョブが失敗した場合のトラブルシューティング方法は?

  • トレーニング構成で適切な max_length を設定してください。トレーニングアルゴリズムは max_length を超えるデータを破棄し、その操作をタスクログに記録します。

    image破棄されるデータが多すぎると、トレーニングまたは検証データセットが空になり、トレーニングジョブが失敗する可能性があります。

    image

  • エラーログ failed to compose dlc job specs, resource limiting triggered, you are trying to use more GPU resources than the threshold は、ジョブがリソース制限をトリガーしたことを示しています。デフォルトでは、トレーニングジョブで同時に実行できる GPU は最大 2 つです。実行中のジョブが完了するのを待ってから新しいジョブを開始するか、チケットを送信してクォータの引き上げをリクエストしてください。

  • エラーログ the specified vswitch vsw-**** cannot create the required resource ecs.gn7i-c32g1.8xlarge, zone not match は、指定されたインスタンスタイプが VSwitch のあるアベイラビリティゾーンで在庫切れであることを示しています。次のソリューションを試すことができます:1. VSwitch を指定しない。DLC は在庫が十分なアベイラビリティゾーンの VSwitch を自動的に選択します。2. 別のインスタンスタイプに切り替える。

Q:トレーニング後にモデルをダウンロードできますか?

はい。トレーニングジョブを作成する際に、モデルの出力パスを OSS ディレクトリに設定できます。ジョブが完了した後、指定された OSS パスからモデルをダウンロードできます。

image

Q:モデルのパフォーマンスが低い場合はどうすればよいですか?

次のソリューションを検討してください。

  1. より高いパラメーター数を持つ DeepSeek または Qwen3 シリーズのモデルなど、ベースラインパフォーマンスが優れたモデルを使用します。

  2. プロンプトを改良します。

  3. max_tokens の値を増やします。

  4. 複雑なタスクを、モデルが個別に処理できるより小さなサブタスクに分割します。

関連トピック