Apa itu PhotoMakerV2
PhotoMakerV2, peningkatan dari PhotoMaker, menawarkan metode efisien untuk generasi teks-ke-gambar pribadi. Ini mensintesis foto realistis individu menggunakan beberapa gambar identitas input dan prompt teks.
Beberapa fitur utama PhotoMakerV2 meliputi:
- Efisiensi tinggi: Cepat menghasilkan foto pribadi.
- Pelestarian identitas yang sangat baik: Mempertahankan kemiripan identitas input.
- Kontrol teks fleksibel: Memungkinkan penentuan konteks, gaya, atribut, dll., dalam prompt.
- Kesetiaan identitas yang ditingkatkan: Ditingkatkan dibandingkan PhotoMaker V1.
PhotoMakerV2 menghasilkan gambar fotorealistik seseorang dalam berbagai konteks, menata penampilan, mengubah atribut seperti usia dan jenis kelamin, menggabungkan identitas, dan memodernisasi orang dari foto atau karya seni lama. Ini membuka berbagai kemungkinan kreatif.
Bagaimana PhotoMakerV2 Bekerja
PhotoMakerV2 mengkodekan satu atau lebih gambar identitas input ke dalam "embedding ID bertumpuk," yang berfungsi sebagai representasi terpadu yang mengenkapsulasi informasi identitas.
Embedding ini, dikombinasikan dengan prompt teks, dimasukkan ke dalam model difusi teks-ke-gambar. Model tersebut kemudian menghasilkan gambar yang menggambarkan identitas yang diembed dalam konteks yang dijelaskan oleh prompt.
Beberapa aspek utama tentang cara kerjanya di balik layar:
- Menggunakan encoder identitas untuk mengekstrak informasi identitas dari gambar wajah input
- Meningkatkan pelestarian identitas dengan memanfaatkan model pengenalan wajah eksternal (InsightFace)
- Mengkodekan beberapa gambar identitas ke dalam embedding bertumpuk untuk menangkap identitas secara komprehensif
- Memasukkan embedding ID bertumpuk ke dalam lapisan cross-attention model difusi
- Membimbing generasi dengan prompt teks sambil menggabungkan informasi identitas secara adaptif
- Dilatih dengan dataset berorientasi identitas untuk meningkatkan kemampuan identifikasi
Cara Menggunakan ComfyUI PhotoMakerV2
Untuk menggunakan PhotoMakerV2 di ComfyUI, berinteraksi terutama dengan node PhotoMakerEncodePlus. Alur kerja tipikal melibatkan:
- Muat model PhotoMakerV2 menggunakan node "PhotoMaker Loader Plus".
- Muat satu atau lebih gambar identitas menggunakan node "Prepare Images For CLIP Vision".
- Muat model InsightFace yang dibutuhkan oleh PhotoMakerV2 menggunakan node "PhotoMaker InsightFace Loader".
- Hubungkan output dari node-node ini ke input yang sesuai dari node "PhotoMaker Encode Plus".
- Di node "PhotoMaker Encode Plus", tentukan prompt yang mendeskripsikan gambar yang diinginkan. Gunakan kata pemicu khusus dalam prompt di mana identitas harus muncul.
- Hubungkan output conditioning dari "PhotoMaker Encode Plus" ke node "KSampler" untuk menghasilkan gambar.
Untuk informasi lebih lanjut, silakan kunjungi dan . Semua kredit diberikan kepada kontribusi mereka.