LongCat Image Edit Turbo : Édition d'image rapide guidée par des invites dans ComfyUI#
LongCat Image Edit Turbo est un flux de travail ComfyUI spécialement conçu pour des éditions rapides guidées par des invites qui conservent votre sujet et votre composition intacts. Il combine le modèle LongCat Image Edit Turbo avec le conditionnement Qwen2.5-VL et l'AE VAE pour offrir un restylage de personnages, des modifications localisées semblables à des masques, et des ajustements d'éclairage cinématographiques dans une boucle rapide, propice à l'itération.
Conçu pour les créateurs et les utilisateurs avancés, ce graphe LongCat Image Edit Turbo accepte n'importe quelle image source, interprète votre intention d'édition à travers un encodeur vision-langage, et renvoie des résultats haute-fidélité qui préservent le cadrage original. Il est prêt à être utilisé avec RunComfy et optimisé pour des aperçus rapides et un raffinement contrôlé.
Modèles clés dans le flux de travail Comfyui LongCat Image Edit Turbo#
- LongCat Image Edit Turbo (bf16). Le modèle de diffusion qui alimente des éditions d'image rapides tout en préservant la composition et en répondant fortement aux instructions textuelles. Fichier du modèle
- Qwen2.5-VL encodeur de texte 7B (FP8 mis à l'échelle, emballé pour ComfyUI). Produit un conditionnement riche en comprenant à la fois votre invite et le contexte visuel de l'image d'entrée. Fichier de l'encodeur
- AE VAE (ae.safetensors). Reconstruit les images à partir de latents avec peu de perte, aidant LongCat Image Edit Turbo à préserver les détails fins après l'échantillonnage. Fichier VAE
Comment utiliser le flux de travail Comfyui LongCat Image Edit Turbo#
Le flux de travail suit un chemin clair de votre image et votre invite jusqu'à un résultat décodé. Les étapes sont organisées autour de quelques composants décisifs qui maintiennent les éditions rapides et stables.
Charger et préparer votre image source#
- Importez votre image avec
LoadImage(#79). Le graphe la route à traversFluxKontextImageScale(#64) pour standardiser l'échelle pour une édition robuste. - L'image définit ensuite la toile de travail via
GetImageSize(#72) etEmptyLatentImage(#61), ce qui aide LongCat Image Edit Turbo à maintenir la composition et le placement du sujet. - Cette préparation garantit que les éditions suivantes agissent comme des ajustements intelligents, semblables à des masques, plutôt que des ré-synthèses complètes.
Encoder votre intention d'édition avec Qwen#
- Le flux de travail charge l'encodeur Qwen2.5-VL en utilisant
CLIPLoader(#19). - Décrivez le changement souhaité dans
TextEncodeQwenImageEditPlus (Positive)(#53). Utilisez des indices clairs de style, d'éclairage ou d'attribut pour que LongCat Image Edit Turbo applique. - Utilisez
TextEncodeQwenImageEditPlus (Negative)(#54) pour lister les éléments à éviter ou à protéger, ce qui aide à préserver l'identité et à éviter les altérations indésirables. - L'encodeur lit à la fois votre texte et l'image source, créant un conditionnement conscient de l'édition qui ancre les changements à la scène originale.
Façonner l'orientation et le mélange de références#
FluxGuidance(#21) etFluxGuidance(#22) ajustent la force avec laquelle les instructions positives et négatives influencent le résultat. Une emphase plus élevée pousse des éditions plus audacieuses ; une emphase plus faible favorise des ajustements subtils, sûrs pour la composition.FluxKontextMultiReferenceLatentMethod(#51) etFluxKontextMultiReferenceLatentMethod(#52) contrôlent comment plusieurs références sont mélangées si vous choisissez de les ajouter. Par défaut, le sous-graphe d'aide étiqueté « NE PAS UTILISER (LAISSER CONTINUER) » reste inactif ; remplacez-le par vos propres chargeurs d'images si vous souhaitez des références de style ou d'attribut supplémentaires.
Exécuter l'échantillonneur#
- Le LongCat Image Edit Turbo UNet est chargé par
UNETLoader(#18) et normalisé pour un guidage stable avecCFGNorm(#23). KSampler(#27) effectue les étapes de diffusion réelles, transformant votre intention et votre contexte en un nouveau latent. Commencez par des itérations rapides pour les aperçus, puis affinez votre invite ou la force du guidage selon les besoins pour la qualité finale.- Gardez les éditions concentrées sur un objectif clair et unique par passage pour des résultats les plus prévisibles.
Décoder et exporter#
- L'AE VAE est apporté via
VAELoader(#20) et utilisé parVAEDecode(#25) pour reconstruire l'image à partir du latent échantillonné avec une haute fidélité. SaveImage(#9) écrit le résultat dans votre répertoire de sortie avec un préfixe clair, ce qui facilite le suivi des variations entre les exécutions.
Nœuds clés dans le flux de travail Comfyui LongCat Image Edit Turbo#
TextEncodeQwenImageEditPlus (Positive)(#53). Convertit votre changement souhaité en un conditionnement conscient de l'édition en utilisant Qwen2.5-VL et l'image source. Concentrez votre invite sur le sujet et le changement souhaité, tel que la tenue, l'ambiance, l'éclairage ou le matériau, pour guider LongCat Image Edit Turbo sans dériver la scène.TextEncodeQwenImageEditPlus (Negative)(#54). Protège l'identité et la composition en spécifiant ce qu'il faut éviter. Utilisez-le pour réduire les artefacts ou empêcher le restylage indésirable tout en gardant la scène cohérente.FluxGuidance(#21). Ajuste l'assertivité avec laquelle les instructions positives dirigent l'édition. Augmentez pour un restylage plus fort ou un éclairage dramatique ; diminuez pour préserver davantage l'apparence originale. Équilibrez cela avec la précision de votre invite et le nombre de références que vous fournissez.FluxKontextMultiReferenceLatentMethod(#51). Détermine comment plusieurs références sont mélangées dans le conditionnement. Choisissez une méthode qui correspond à votre objectif, par exemple une fusion plus forte pour le transfert de style contre une influence plus légère pour les ajustements d'attributs.CFGNorm(#23). Normalise le comportement du guidage afin que les changements restent cohérents dans différents réglages. Il aide LongCat Image Edit Turbo à rester stable lorsque vous itérez des invites ou changez d'échantillonneur.KSampler(#27). Le cœur de la génération. Utilisez-le pour itérer rapidement, verrouiller une graine pour la reproductibilité, et expérimenter avec différents échantillonneurs une fois que vous aimez la direction. Ajustez en tandem avecFluxGuidancepour équilibrer la force de l'édition par rapport à la fidélité à l'original.FluxKontextImageScale(#64). Prépare et met à l'échelle l'image d'entrée pour les nœuds en aval. Cette étape est essentielle pour maintenir le cadrage et les proportions stables tout au long de l'édition.
Extras optionnels#
- Ajoutez plus de références. Si vous souhaitez un guidage multi-image, remplacez le sous-graphe d'aide contourné par vos propres nœuds
LoadImageet branchez-les dans les entrées de référence supplémentaires des nœuds d'encodage Qwen. Cela est utile pour les transferts de style ou de garde-robe tout en maintenant la pose et la mise en page. - Conseils pour une itération rapide. Commencez avec des invites concises, lancez un aperçu rapide, puis affinez le libellé ou la force du guidage. Utilisez des graines pour reproduire un look favori et diversifiez de petites variations.
- Modifications localisées par formulation. Spécifiez clairement la cible, comme "changer uniquement la veste en rouge" ou "lumière de bord doux sur le sujet", pour effectuer des éditions semblables à des masques sans nécessiter de masque explicite.
- Variante GGUF. Pour les scénarios CPU ou très faible VRAM, vous pouvez passer à des poids quantifiés LongCat Image Edit Turbo avec
UnetLoaderGGUF(#77). Voir le pack GGUF pour les quantifications disponibles. Variantes du modèle
Remerciements#
Ce flux de travail implémente et s'appuie sur les travaux et ressources suivants. Nous remercions chaleureusement Comfy-Org pour LongCat Image Edit Turbo et les composants associés, vantagewithai pour les modèles GGUF LongCat Image Edit Turbo, et la communauté Civitai pour le flux de travail LongCat Image Edit Turbo pour leurs contributions et leur maintenance. Pour des détails autoritatifs, veuillez vous référer à la documentation originale et aux dépôts liés ci-dessous.
Ressources#
- Source du flux de travail Civitai/Civitai
- Docs / Notes de publication : Page du modèle Civitai
- Comfy-Org/LongCat Image Edit Turbo modèle bf16
- Hugging Face : Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo modèles GGUF
- Hugging Face : vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VL encodeur de texte
- Hugging Face : Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face : Comfy-Org/z_image_turbo
Note : L'utilisation des modèles, ensembles de données et codes référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.









