Co je PhotoMakerV2
PhotoMakerV2, upgrade z PhotoMaker, nabízí efektivní metodu pro personalizované generování obrázků z textu. Syntetizuje realistické fotografie jednotlivců pomocí několika vstupních identitních obrázků a textové výzvy.
Některé klíčové vlastnosti PhotoMakerV2 zahrnují:
- Vysoká efektivita: Rychle generuje personalizované fotografie.
- Vynikající zachování identity: Zachovává podobu vstupních identit.
- Flexibilní textová kontrola: Umožňuje specifikovat kontext, styl, atributy atd. ve výzvě.
- Zlepšená věrnost identity: Vylepšeno ve srovnání s PhotoMaker V1.
PhotoMakerV2 generuje fotorealistické obrázky osoby v různých kontextech, stylizuje vzhled, mění atributy jako věk a pohlaví, spojuje identity a modernizuje lidi ze starých fotografií nebo uměleckých děl. Otevírá nesčetné kreativní možnosti.
Jak PhotoMakerV2 funguje
PhotoMakerV2 kóduje jeden nebo více vstupních identitních obrázků do "stacked ID embedding", což slouží jako jednotná reprezentace zahrnující identitní informace.
Toto embedding, kombinované s textovou výzvou, vstupuje do modelu difúze textu na obrázek. Model poté vytvoří obrázek zobrazující vloženou identitu v kontextu popsaném výzvou.
Některé klíčové aspekty fungování v zákulisí:
- Používá identitní enkodér k extrakci identitních informací z vstupních obličejových obrázků
- Zlepšuje zachování identity využitím externího modelu rozpoznávání obličejů (InsightFace)
- Kóduje více identitních obrázků do stacked embedding k zachycení identity komplexně
- Vkládá stacked ID embedding do cross-attention vrstev modelu difúze
- Řídí generování textovou výzvou a zároveň adaptivně spojuje identitní informace
- Trénováno s identitně orientovanou datovou sadou k vylepšení identifikačních schopností
Jak používat ComfyUI PhotoMakerV2
K použití PhotoMakerV2 v ComfyUI primárně interagujte s uzlem PhotoMakerEncodePlus. Typický pracovní postup zahrnuje:
- Načtěte model PhotoMakerV2 pomocí uzlu "PhotoMaker Loader Plus".
- Načtěte jeden nebo více identitních obrázků pomocí uzlu "Prepare Images For CLIP Vision".
- Načtěte model InsightFace vyžadovaný PhotoMakerV2 pomocí uzlu "PhotoMaker InsightFace Loader".
- Připojte výstupy těchto uzlů k odpovídajícím vstupům uzlu "PhotoMaker Encode Plus".
- V uzlu "PhotoMaker Encode Plus" specifikujte výzvu popisující požadovaný obrázek. Použijte speciální spouštěcí slovo ve výzvě, kde by se měla objevit identita.
- Připojte výstupní kondicionování z "PhotoMaker Encode Plus" k uzlu "KSampler" pro generování obrázku.
Pro více informací prosím navštivte a . Veškerý kredit patří jejich příspěvkům.