Wan2.2 Fun Inp convierte dos imágenes fijas en un video coherente guiando el modelo desde un primer fotograma hasta un último fotograma con interpolación natural entre ellos. Está diseñado para artistas, animadores y cineastas que desean consistencia cinematográfica mientras mantienen el control de las instrucciones. El flujo de trabajo incluye dos preajustes paralelos para que puedas priorizar la síntesis ultrarrápida de 4 pasos o una generación más general escalada fp8, ambos impulsados por Wan 2.2 Fun Inpaint.
Wan2.2 Fun Inp convierte dos imágenes fijas en un video coherente guiando el modelo desde un primer fotograma hasta un último fotograma con interpolación natural entre ellos. Está diseñado para artistas, animadores y cineastas que desean consistencia cinematográfica mientras mantienen el control de las instrucciones. El flujo de trabajo incluye dos preajustes paralelos para que puedas priorizar la síntesis ultrarrápida de 4 pasos o una generación más general escalada fp8, ambos impulsados por Wan 2.2 Fun Inpaint.
Wan 2.2 Fun Inpaint 14B (fp8 escalado)
La columna vertebral principal de difusión especializada para la generación de videos “Fun Inpaint”. Se incluyen dos variantes: ruido alto para movimientos más grandes y transiciones creativas, y ruido bajo cuando necesitas mayor fidelidad a tus fotogramas de inicio/fin.
• Ruido alto:
• Ruido bajo:
Lightning 4-Step LoRA para I2V
Un LoRA opcional que comprime el programa de muestreo a solo cuatro pasos para iteración rápida, ideal para vistas previas y borradores rápidos.
• LoRA de ruido bajo:
• LoRA de ruido alto:
Wan VAE
El VAE maneja las conversiones latente–píxel utilizadas por los modelos Wan; conserva el detalle y el tono durante la decodificación/codificación. Ver el paquete Wan 2.2 en .
Codificador de texto CLIP
Codifica tus instrucciones positivas y negativas en vectores de acondicionamiento que guían la narrativa visual. Implementación de referencia: .
Suite de Ayuda de Video ComfyUI (exportar)
Combina fotogramas generados en un MP4 a la tasa de fotogramas que elijas. Repositorio: .
El gráfico contiene dos grupos paralelos que puedes alternar dependiendo de la velocidad vs la generalidad. Habilita solo uno a la vez para ejecuciones limpias.
Usa esto para vistas previas muy rápidas. El grupo carga la columna vertebral Wan 2.2 más un Lightning 4-Step LoRA y dirige tus instrucciones a través del camino de muestreo corto. Proporciona tus imágenes de inicio y fin, luego ajusta los parámetros de alto nivel según sea necesario. Internamente, WanFunInpaintToVideo
(#111) siembra la trayectoria desde el primer hasta el último fotograma, mientras que un muestreador corto refina el movimiento y la estructura en unos pocos pasos.
Elige esto cuando desees un rango operativo más amplio sin la restricción de 4 pasos. Esta ruta utiliza directamente el modelo Wan 2.2 escalado fp8, manteniendo la misma guía de fotograma de primero a último pero con un presupuesto estándar de muestreo para una recuperación de detalles más matizada y una configuración de movimiento. El nodo WanFunInpaintToVideo
(#148) ancla la trayectoria y la entrega al muestreador descendente para refinamiento.
Ambos grupos incluyen una sección de Cargar imágenes de inicio y fin. Conecta una imagen de inicio que establezca la composición de apertura y una imagen de fin que defina la pose o escena final. El flujo de trabajo interpolará el movimiento y la apariencia entre ellas, respetando tus instrucciones de texto. Para obtener mejores resultados, mantén la relación de aspecto consistente en ambas imágenes.
Escribe lo que deseas ver en el Instrucción Positiva y lo que deseas evitar en el Instrucción Negativa. Los nodos CLIP Text Encode (Positive Prompt)
y CLIP Text Encode (Negative Prompt)
transforman tu texto en acondicionamiento que guía el contenido, el estilo y la dinámica. Usa frases concisas orientadas a la escena (acciones, indicaciones de cámara, materiales, ambiente) en lugar de largas listas.
Establece width
, height
y length
en el nodo WanFunInpaintToVideo
para definir la resolución espacial y el conteo de fotogramas. Los valores predeterminados están ajustados para un video alto de 576×1024 con aproximadamente 3–4 segundos de movimiento a 24 fps. Las secuencias más largas generalmente se benefician del camino escalado fp8; las vistas previas cortas son excelentes con el grupo de 4 pasos LoRA.
VHS_VideoCombine
ensambla fotogramas en un MP4 con un 24 fps predeterminado y un CRF amigable con la calidad. Los nombres de los archivos están prefijados para cada rama (por ejemplo, Fun_Inp
y Fun_Inp_4_Step
) para que puedas comparar fácilmente los resultados. Ajusta la tasa de fotogramas si necesitas una reproducción más lenta o más rápida.
Selecciona un grupo y usa Ctrl+B para habilitarlo o deshabilitarlo. Si habilitas el grupo fp8_scaled, deshabilita el grupo fp8_scaled + 4 pasos LoRA, y viceversa. También puedes usar las funciones de ejecución parcial de ComfyUI para ejecutar solo las secciones que estás ajustando.
WanFunInpaintToVideo
(#111 y #148)El motor principal que fusiona tu start_image y end_image en una trayectoria continua latente. Acepta width
, height
y length
para establecer el tamaño y la duración del video, luego emite una secuencia latente más un acondicionamiento positivo/negativo actualizado. Comienza aquí cuando ajustes la continuidad, el ritmo o la composición a lo largo de la toma.
UNETLoader
(#101, #102)Elige la variante del modelo Wan 2.2 Fun Inpaint. Usa ruido alto para movimientos más audaces e interpolaciones más transformadoras. Usa ruido bajo cuando preservar la identidad y textura del fotograma de inicio y fin es la prioridad. Combina cualquiera de ellos con o sin el 4-step LoRA dependiendo de las necesidades de velocidad.
ModelSamplingSD3
(#93)Configura el programa de muestreo utilizado en el flujo descendente. Manténlo alineado con el LoRA o el camino fp8 elegido. Si ves parpadeo temporal, ajustes modestos al modo de muestreo o pasos pueden suavizar las transiciones sin sobreenfocar los detalles.
KSamplerAdvanced
(#150)Aplica un pase de refinamiento a la secuencia latente. Aumenta los pasos ligeramente si necesitas micro-detalles más nítidos en rostros, manos o estructuras delgadas; reduce los pasos para un movimiento más suave y onírico. Evita valores CFG extremos o conteos de pasos que puedan desestabilizar la consistencia temporal.
VHS_VideoCombine
(#159)Fusiona fotogramas renderizados a MP4. Ajusta frame_rate
para la sensación de movimiento y la velocidad de reproducción, y mantén el pix_fmt
predeterminado para una amplia compatibilidad de reproductores. Un CRF más bajo produce archivos más grandes con gradientes más finos; un CRF más alto comprime de manera más agresiva.
width
×height
seleccionado para reducir el recorte o distorsión no deseados.El flujo de trabajo Wan 2.2 Inp Fun amplía las posibilidades creativas de la generación de video AI al unir el control de fotogramas de inicio a fin con la interpolación natural. Es una herramienta versátil para artistas, animadores y cineastas que desean consistencia cinematográfica en sus proyectos impulsados por AI.
Un agradecimiento especial a los equipos de ComfyUI y Wan por permitir la integración fluida del flujo de trabajo Inp Fun en tuberías creativas de próxima generación.
RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.