AI Toolkit LoRAトレーニングガイド

AI Toolkit LoRA学習を設定Steps後に再開する

AI ToolkitでLoRA学習を再開するガイド:停止したjobを編集し、Stepsを新しい最終総数に増やし、最後のcheckpointから続行します。

Ostris AI Toolkitで拡散モデルをトレーニング

AI Toolkit のジョブが設定した Steps に到達して停止した後に、学習を継続する方法(同じ LoRA を再開)

1) 「これは自分のケース?」

Steps = 2000 を設定して学習を開始し、ジョブが step 2000 に達した時点で 自動的に停止 した。

Samples / 推論を確認したあと、もう少し学習したい けれど、新しい LoRA をゼロから作り直したくない。既存の job / checkpoint から 続きで学習したい

もしこれがあなたの状況なら、このガイドが役に立ちます。


2) 何が起きているか

AI Toolkit では、Steps = その job の総トレーニング step 数 です。

つまり Steps = 2000 にすると、trainer は指定どおりに動きます:

  • step 2000 まで学習する
  • そこで停止する

同じ LoRA を続けて学習するには、新しい job を作るのではなく、既存の job を編集 して 最終的な総 Steps を増やし、もう一度実行します。trainer は 最後に保存された checkpoint から再開 して続行します。


3) 学習を再開する方法(手順)

Step A — 続行したい job を開く

  1. Training Queue(または job list)に行く
  2. 完了した job(2000 steps で止まったもの)を探す
  3. その job の Edit をクリックして job エディタを開く

トレーニング job の Edit ボタン

Step B — 総 Steps を増やす

  1. Training セクションまでスクロールする
  2. Steps を見つける
  3. 新しい 最終的な合計 step 数に変更する

トレーニング job の Steps を更新

重要: ここでの数値は「最終的な合計」であり、「追加分」ではありません。

例:

  • 2000 まで学習した
  • 1000 追加したい
  • Steps = 3000 にする(1000 ではない)

Step C — 保存して再スタート

  1. Update Job をクリック
  2. Start Training をクリック

✅ これで job は 前回の続きから再開 し、最後の checkpoint を使って、新しい Steps の値まで学習するはずです。


4) 再開しない場合(すぐ確認できること)

step 0 からやり直してしまう、または続行できない場合は、次を確認してください:

  • 終盤の checkpoint が保存されていますか?

    job の outputs / 保存ファイルを確認してください。checkpoint が一度も保存されていない場合、再開できません。

  • checkpoints を保持していますか?

    “Max Step Saves to Keep” が低く、古い保存が削除されている場合は、最新の checkpoint が残っているか確認してください。

  • Steps 以外も変更していませんか?

    きれいに再開するには、同じ dataset と学習設定を維持し、変更は Steps のみにしてください。


5) 1 行まとめ

設定した Steps で停止したあとに同じ LoRA を続けて学習するには:

完了した job を Edit → Steps を新しい最終合計に増やす → Update Job → Start Training。

トレーニングを開始する準備はできましたか?