So setzt du das Training fort, nachdem dein AI Toolkit‑Job die voreingestellten Steps erreicht hat (dieselbe LoRA weitertrainieren)
1) „Ist das mein Problem?“
Du hast Steps = 2000 gesetzt, das Training gestartet, und der Job hat automatisch gestoppt, sobald Schritt 2000 erreicht war.
Nachdem du Samples / Inferenz geprüft hast, willst du weitertrainieren, aber du willst keine komplett neue LoRA von vorne starten — du willst vom bestehenden Job/Checkpoint aus weitermachen.
Wenn das auf dich zutrifft, ist dieser Guide für dich.
2) Was passiert hier
In AI Toolkit bedeutet Steps = die Gesamtzahl der Trainingsschritte für den Job.
Wenn du also Steps = 2000 setzt, macht der Trainer genau das, was du ihm sagst:
- trainiert bis Schritt 2000
- stoppt dann
Um dieselbe LoRA weiterzutrainieren, erstellst du keinen neuen Job. Du bearbeitest den bestehenden Job, erhöhst die finale Gesamtzahl an Steps und startest ihn erneut. Der Trainer wird vom zuletzt gespeicherten Checkpoint aus fortsetzen und weitertrainieren.
3) So setzt du das Training fort (Schritt für Schritt)
Schritt A — Öffne den Job, den du fortsetzen willst
- Gehe zu deiner Training Queue (oder zur Job‑Liste)
- Finde den abgeschlossenen Job (der bei 2000 Steps gestoppt hat)
- Klicke bei diesem Job auf Edit, um den Job‑Editor zu öffnen

Schritt B — Erhöhe die Gesamtzahl der Steps
- Scrolle zum Abschnitt Training
- Finde Steps
- Setze ihn auf deine neue finale Gesamtzahl an Steps

Wichtig: Diese Zahl ist die finale Gesamtsumme, nicht „zusätzliche Steps“.
Beispiel:
- Du hast bis 2000 trainiert
- Du willst 1000 mehr
- Setze Steps = 3000 (nicht 1000)
Schritt C — Speichern und neu starten
- Klicke Update Job
- Klicke Start Training
✅ Der Job sollte jetzt vom vorherigen Lauf aus fortsetzen, den letzten Checkpoint verwenden und bis zum neuen Steps‑Wert trainieren.
4) Wenn es nicht fortsetzt (Schnellchecks)
Wenn es wieder bei Schritt 0 startet oder sich weigert weiterzulaufen, prüfe Folgendes:
- Gibt es einen Checkpoint nahe am Ende?
Schau in deine Job‑Outputs / gespeicherten Dateien. Wenn dein Job nie einen Checkpoint gespeichert hat, kann er nicht fortsetzen.
- Hast du Checkpoints behalten?
Wenn dein „Max Step Saves to Keep“ niedrig ist und ältere Saves bereinigt wurden, stell sicher, dass der neueste Checkpoint noch existiert.
- Hast du mehr als Steps geändert?
Damit das Resuming sauber klappt, nutze dasselbe Dataset und dieselben Trainingseinstellungen. Ändere nur Steps.
5) Einzeiler‑Zusammenfassung
Um dieselbe LoRA weiterzutrainieren, nachdem sie bei deinen voreingestellten Steps stoppt:
Fertigen Job bearbeiten → Steps auf die neue finale Gesamtzahl erhöhen → Update Job → Start Training.
Ready to start training?
