# WAN 2.2 I2V Character Consistency: So beheben Sie Face Drift mit einer Character LoRA Wenn Sie nach **WAN 2.2 I2V character consistency** suchen, stoßen Sie meist auf immer dasselbe Problem: Der erste Frame sieht richtig aus, aber sobald die Person lächelt, den Kopf dreht oder die Pose wechselt, sieht das Gesicht nicht mehr wie dieselbe Person aus. Diese Seite richtet sich an Nutzer, die eine **Character LoRA für WAN 2.2 I2V** brauchen, weil die **gleiche Figur auch während der Bewegung klar wiedererkennbar bleiben soll** und nicht nur in einem gelungenen Startbild. Am Ende wissen Sie: - warum **WAN 2.2 I2V** so leicht Identität verliert - wann ein **Referenzbild** ausreicht und wann zusätzlich eine **Character LoRA** nötig ist - ob Sie besser eine **T2V**-Character-LoRA, eine **I2V**-Character-LoRA oder beide Workflows zusammen verwenden sollten - wie Sie ein Dataset aufbauen, das **Identity Drift** und **Face Morphing** reduziert - wie Sie den Trainings-Workflow im **Ostris AI Toolkit** ausführen > Dieser Artikel ist Teil der AI-Toolkit-LoRA-Trainingsreihe. Wenn Sie zuerst die vollständige Übersicht Schritt für Schritt sehen möchten, starten Sie mit dem Hauptleitfaden zum [Wan 2.2 I2V 14B LoRA Training](https://www.runcomfy.com/de/trainer/ai-toolkit/wan-2-2-i2v-14b-lora-training). --- ## Inhaltsverzeichnis - [1. Warum WAN 2.2 I2V Character Consistency bei Bewegung zerbricht](#wan22-i2v-consistency-section-1) - [2. Referenzbild oder Character LoRA: Was behebt Face Drift wirklich?](#wan22-i2v-consistency-section-2) - [3. Sollten Sie für WAN 2.2 eine T2V- oder I2V-Character-LoRA trainieren?](#wan22-i2v-consistency-section-3) - [4. Bestes Dataset-Design für WAN 2.2 I2V Character Consistency](#wan22-i2v-consistency-section-4) - [5. Bestes AI-Toolkit-Rezept für WAN 2.2 I2V Character LoRAs](#wan22-i2v-consistency-section-5) - [6. Warum WAN 2.2 I2V Identity Drift und Face Morphing auftreten](#wan22-i2v-consistency-section-6) - [7. Wann RunComfy Cloud AI Toolkit die bessere Wahl ist](#wan22-i2v-consistency-section-7) - [8. Fazit](#wan22-i2v-consistency-section-8) --- ## 1. Warum WAN 2.2 I2V Character Consistency bei Bewegung zerbricht Der schwierige Teil bei **WAN 2.2 I2V character consistency** ist, dass das Modell zwei Aufgaben gleichzeitig lösen muss: - die Identität aus dem Quellbild bewahren - glaubwürdige Bewegung, Mimik und Perspektivwechsel über die Zeit erzeugen Diese Ziele arbeiten gegeneinander. Je mehr Bewegung, Kameraveränderung oder Ausdruckswechsel Sie verlangen, desto mehr Gelegenheiten hat das Modell, das Gesicht neu zu "interpretieren", statt es stabil zu erhalten. Darum taucht immer wieder dasselbe Muster auf: - ein neutraler erster Frame kommt dem Ziel noch nahe - ein Lächeln führt plötzlich zu einem anderen Gesicht - Kopfdrehungen schwächen die Identität - Posenwechsel lassen die Figur eher wie eine Verwandte als wie dieselbe Person wirken Anders gesagt: Das Problem ist nicht nur "besseres Prompting". Es ist ein Problem der **Identitätskontrolle**. --- ## 2. Referenzbild oder Character LoRA: Was behebt Face Drift wirklich? ### 2.1 Nur Referenzbild Ein einzelnes **Referenzbild** ist nützlich für: - Startpose und Bildausschnitt - grobe Vertrautheit des Gesichts - anfängliche Verankerung von Kleidung und Szene In der Praxis liefert ein Workflow nur mit Referenzbild meist **Wiedererkennbarkeit**, aber keine echte Konsistenz. ### 2.2 Nur Character LoRA Eine **Character LoRA** ist nützlich für: - das Mitnehmen der Identität in neue Prompts - dieselbe Person über mehrere Szenen hinweg wiedererkennbar zu halten - etwas zu bekommen, das Sie szenenübergreifend weiterverwenden können, statt sich auf einen einzigen Startframe zu verlassen Aber eine Character LoRA allein ersetzt in I2V kein gutes Quellbild vollständig. Sie fixiert nicht automatisch Pose, Kamera oder die exakte Frame-zu-Frame-Struktur. ### 2.3 Referenzbild + Character LoRA Für viele Nutzer ist das die stärkste praktische Kombination. Nutzen Sie das **Referenzbild**, um den Shot zu verankern. Nutzen Sie die **Character LoRA**, um die Identität zu verankern. Deshalb kombinieren viele erfahrene WAN-Nutzer am Ende beides, statt es als Entweder-oder zu betrachten. --- ## 3. T2V vs. I2V Character LoRA für WAN 2.2 Das ist eine der häufigsten Fragen rund um **WAN 2.2 I2V character consistency**. ### 3.1 Warum viele T2V-Character-LoRAs in I2V nutzen Eine **für T2V trainierte Character LoRA** funktioniert oft auch innerhalb von **I2V**-Workflows gut. Das ergibt Sinn, wenn Ihr Hauptziel ist: - "diesen Charakter über verschiedene Prompts hinweg konsistent zu halten" - "das Gesicht in vielen Szenen wiedererkennbar zu machen" - "dieselbe Character LoRA sowohl in T2V als auch in I2V zu verwenden" Dann vermittelt die LoRA vor allem **wer der Charakter ist**, nicht wie sich ein bestimmter Startframe bewegen soll. ### 3.2 Wann sich eine I2V-spezifische Character LoRA lohnt Trainieren Sie eine **I2V-fokussierte** Character LoRA, wenn Ihr Problem konkreter ist: - das Gesicht zerfällt beim Lächeln - Profilansichten sind der Schwachpunkt - Bewegung führt zu Morphing - Ihnen ist wichtig, dass dieselbe Person trotz wechselnder Kamerawinkel und Mimik erhalten bleibt Dann werden bewegungsbewusste Identitätsdaten deutlich wertvoller. ### 3.3 Praktische Empfehlung Wenn Sie eine einfache Regel möchten: - beginnen Sie mit einer **Character LoRA**, die die Identität sauber einfängt - nutzen Sie sie in **WAN 2.2 I2V** zusammen mit einem starken Referenzbild - wechseln Sie erst dann zu einem stärker I2V-spezifischen Dataset, wenn driftende Identität durch Bewegung weiterhin das Hauptproblem bleibt --- ## 4. Bestes Dataset-Design für WAN 2.2 I2V Character Consistency Wenn Ihr Ziel **derselbe Charakter in WAN 2.2 I2V** ist, sollte Ihr Dataset Identität unter Veränderung vermitteln und nicht Identität in nur einer eingefrorenen Pose. ### 4.1 Clips mit gut sichtbarem Gesicht priorisieren Verwenden Sie Clips, in denen: - das Gesicht groß genug ist, um relevant zu sein - sich Mimik verändert - der Kopf sich dreht - die Figur sich natürlich bewegt, ohne extreme Unschärfe Wenn das Gesicht nur einen winzigen Teil des Frames einnimmt, hat das Modell weniger Identitäts-Pixel, aus denen es lernen kann. ### 4.2 Bauen Sie das Dataset um die Fehlerfälle auf, die Ihnen wirklich wichtig sind Sammeln Sie keine zufälligen Clips. Sammeln Sie Clips, die genau der Suchintention hinter dieser Seite entsprechen: - lächeln ohne Face Drift - den Kopf drehen ohne Identitätsverlust - Posen wechseln ohne Morphing - konsistente Identität in Nahaufnahmen und mittleren Einstellungen ### 4.3 Halten Sie das Identitätssignal sauber Verwenden Sie im ganzen Dataset dieselbe Person oder denselben Charakter. Vermeiden Sie: - stark gemergte Checkpoints als Basis - niedrig aufgelöstes, stark komprimiertes Video - Clips, in denen Bewegungsunschärfe das Gesicht zerstört - zu viele Clips, in denen das Gesicht winzig ist ### 4.4 Denken Sie wie bei einem Turnaround Wenn möglich, sollten enthalten sein: - Frontansicht - Dreiviertelansicht - Seitenansicht - verschiedene Gesichtsausdrücke - unterschiedliche Beleuchtung Das Modell soll lernen: > Das ist immer noch dieselbe Person, auch wenn sich die Ansicht ändert. ### 4.5 Ein hilfreicher Upstream-Trick Ein nützlicher Trick weiter vorne in der Pipeline ist, zunächst mit einem Bildbearbeitungsmodell wie **Qwen Image Edit** ein konsistentes Character Sheet aus mehreren Blickwinkeln zu erzeugen und darauf basierend das WAN-Character-Dataset aufzubauen. Das kann besonders sinnvoll sein, wenn Ihr Rohmaterial uneinheitlich ist, die Identität aber sehr wichtig bleibt. --- ## 5. Bestes AI-Toolkit-Rezept für WAN 2.2 I2V Character LoRAs Verwenden Sie den Hauptleitfaden für das **Wan 2.2 I2V**-Training für die vollständige Schritt-für-Schritt-Anleitung. Für identitätsfokussierte Arbeit sind dies die praktischen Standardwerte, über die Sie zuerst nachdenken sollten. ### Dataset und Clip-Länge - beginnen Sie mit **kurzen Clips, in denen das Gesicht gut lesbar ist** - verwenden Sie zunächst eine konservative **Num Frames**-Einstellung wie `21` oder `41` - halten Sie die Auflösung eher konservativ, bis der Run stabil läuft ### Modellverhalten Identität in WAN hängt stark von den Verfeinerungsphasen mit weniger Rauschen ab, aber Sie brauchen weiterhin die Bewegungs- und Kompositionsanteile aus der Phase mit höherem Rauschen. Für die meisten Character LoRAs bedeutet das: - trainieren Sie **beide Stufen** - schalten Sie die Bewegungsseite nicht vollständig ab - halten Sie das Training ausgewogen, bevor Sie es gezielt stärker auf Details ausrichten ### Trigger-Strategie Wenn Sie eine Character LoRA wollen, die Sie langfristig weiterverwenden können: - verwenden Sie ein eindeutiges **Trigger-Wort** - halten Sie die Captions einfach und konsistent - beschreiben Sie, was variabel bleiben soll, nicht jedes einzelne Gesichtsdetail ### Sampling-Strategie Verwenden Sie über alle Checkpoints hinweg dasselbe: - Referenzbild - Prompt-Template - Seed - Preview-Kadenz nur so können Sie wirklich beurteilen, ob die Konsistenz besser wird. Wenn Sie während der Evaluation ständig alles verändern, wissen Sie am Ende nicht, ob die LoRA besser geworden ist oder sich nur Ihr Test verändert hat. --- ## 6. Warum WAN 2.2 I2V Identity Drift und Face Morphing auftreten ### 6.1 Das Gesicht ist zu klein Das ist eine der häufigsten realen Ursachen. Wenn das Gesicht zu wenige Pixel hat, kann das Modell nicht bewahren, was es nicht klar genug erkennen kann. ### 6.2 Sie verwenden gemergte oder unordentliche Basen **Gemergte Modelle** haben oft eine schlechtere Gesichtskonsistenz als saubere Basis-Setups. Wenn Identität Ihre eigentliche Aufgabe ist, nehmen Sie zuerst die stabilste verfügbare Basis. ### 6.3 Das Dataset vermittelt nur einen einzigen Ausdruck Wenn alle Daten neutral und front-facing sind, liegen lächelnde oder Profilaufnahmen zur Inferenzzeit schnell außerhalb der Verteilung. ### 6.4 Der Prompt fordert Veränderung, ohne die Identität explizit zu schützen Prompt-Hacks ersetzen keine gute LoRA, aber sie helfen trotzdem. Wenn Sie starke Bewahrung möchten, sagen Sie das klar: - preserve the same face - keep facial features consistent - maintain the character identity from the reference image ### 6.5 Sie haben erwartet, dass das Referenzbild allein alles löst Referenzbilder helfen, aber sie lösen Ausdrucksdrift über die Zeit nicht auf magische Weise. Genau deshalb suchen Menschen überhaupt nach **WAN 2.2 I2V character LoRA**-Workflows. --- ## 7. Wann RunComfy Cloud AI Toolkit die bessere Wahl ist Wenn Sie das ernsthaft betreiben, ist **WAN 2.2 I2V character consistency** ein gutes Beispiel für eine Aufgabe, bei der Cloud-Training viel Zeit sparen kann. Nutzen Sie **RunComfy Cloud AI Toolkit**, wenn: - Ihre lokale GPU mit Video-Training kämpft - Sie mehrere Datasets schnell testen möchten - Sie Preview-Clips und Checkpoints in einem persistenten Workspace organisiert halten möchten - Ihr Ziel eine Character LoRA ist, die szenenübergreifend nützlich bleibt, und kein Hardware-Experiment Bei WAN-I2V-Arbeit liegt der größte Aufwand oft nicht im Training selbst. Er entsteht durch die vielen schlechten Wiederholungsversuche, die aus instabilen lokalen Grenzen resultieren. Wenn Ihr Problem bei der Identitätskontrolle geschäftskritisch ist, ist ein stabileres Trainingsumfeld oft der schnellere Weg zu einem brauchbaren Ergebnis. **Hier öffnen:** [RunComfy Cloud AI Toolkit](https://www.runcomfy.com/de/trainer/ai-toolkit/app) --- ## 8. Fazit Um **WAN 2.2 I2V character consistency** zu verbessern, ist meist dieser Ansatz am praktikabelsten: 1. verwenden Sie ein starkes **Referenzbild** 2. ergänzen Sie eine **Character LoRA**, die über verschiedene Prompts hinweg stabil bleibt 3. trainieren Sie auf Clips, die die echten Fehlerfälle abbilden: Lächeln, Drehungen und Bewegung 4. halten Sie die Evaluation über alle Checkpoints hinweg konsistent Wenn Ihren Nutzern **derselbe Charakter, bessere Kontrolle und weniger fehlerhafte Outputs** wichtig sind, ist das das richtige mentale Modell für diese Seite. Sie trainieren kein allgemeines Modell. Sie trainieren eine **LoRA, die denselben Charakter während der Bewegung auf WAN 2.2 I2V wiedererkennbar hält**.