AI Toolkit のジョブが設定した Steps に到達して停止した後に、学習を継続する方法(同じ LoRA を再開)
1) 「これは自分のケース?」
Steps = 2000 を設定して学習を開始し、ジョブが step 2000 に達した時点で 自動的に停止 した。
Samples / 推論を確認したあと、もう少し学習したい けれど、新しい LoRA をゼロから作り直したくない。既存の job / checkpoint から 続きで学習したい。
もしこれがあなたの状況なら、このガイドが役に立ちます。
2) 何が起きているか
AI Toolkit では、Steps = その job の総トレーニング step 数 です。
つまり Steps = 2000 にすると、trainer は指定どおりに動きます:
- step 2000 まで学習する
- そこで停止する
同じ LoRA を続けて学習するには、新しい job を作るのではなく、既存の job を編集 して 最終的な総 Steps を増やし、もう一度実行します。trainer は 最後に保存された checkpoint から再開 して続行します。
3) 学習を再開する方法(手順)
Step A — 続行したい job を開く
- Training Queue(または job list)に行く
- 完了した job(2000 steps で止まったもの)を探す
- その job の Edit をクリックして job エディタを開く

Step B — 総 Steps を増やす
- Training セクションまでスクロールする
- Steps を見つける
- 新しい 最終的な合計 step 数に変更する

重要: ここでの数値は「最終的な合計」であり、「追加分」ではありません。
例:
- 2000 まで学習した
- 1000 追加したい
- Steps = 3000 にする(1000 ではない)
Step C — 保存して再スタート
- Update Job をクリック
- Start Training をクリック
✅ これで job は 前回の続きから再開 し、最後の checkpoint を使って、新しい Steps の値まで学習するはずです。
4) 再開しない場合(すぐ確認できること)
step 0 からやり直してしまう、または続行できない場合は、次を確認してください:
- 終盤の checkpoint が保存されていますか?
job の outputs / 保存ファイルを確認してください。checkpoint が一度も保存されていない場合、再開できません。
- checkpoints を保持していますか?
“Max Step Saves to Keep” が低く、古い保存が削除されている場合は、最新の checkpoint が残っているか確認してください。
- Steps 以外も変更していませんか?
きれいに再開するには、同じ dataset と学習設定を維持し、変更は Steps のみにしてください。
5) 1 行まとめ
設定した Steps で停止したあとに同じ LoRA を続けて学習するには:
完了した job を Edit → Steps を新しい最終合計に増やす → Update Job → Start Training。
トレーニングを開始する準備はできましたか?
