FusionX：电影级AI图像转视频

community/wan-2-1/fusionx/image-to-video

FusionX 通过使用 Wan2.1-14B-Fusionx_Image2Video 模型与 NAG 引导融合，从文本提示或参考图像生成流畅且高质量的电影级视频。

Image *

Prompt *

Resolution (W:H)

Number of Frames

Frames Per Second

Seed

Steps

Number of denoising iterations; more steps refine detail and stability but take longer.

Guidance Scale

Controls how strongly the output adheres to the prompt versus allowing creative variation.

Shift

Offsets the diffusion sampling schedule, trading stability for stronger motion/style as the value increases.

Idle

The rate is $0.09 per second, 1 second equals 16 frames.

FusionX 简介#

Wan FusionX 是一项在视频生成领域的突破性技术，它将 WAN 生态系统的核心优势融合为一个由 NAG（Normalized Attention Guidance，归一化注意力引导）驱动的统一模型。通过整合 CausVid、AccVideo、MoviiGen1.1 以及 LoRA 精调模型，FusionX 能够在文本生成视频（text-to-video）和图像生成视频（image-to-video）两种工作流中，输出电影级视频品质。

FusionX 让你能够以最少的步骤创建高质量、流畅且视觉精准的视频作品。它专为希望基于文本或图像提示生成电影级镜头的创作者、电影制作者和艺术家而设计。凭借快速渲染、内存高效及强化的提示响应能力，FusionX 是专业级视频生成的不二之选。

FusionX 的核心模型#

Wan2.1-14B-Fusionx_Image2Video#

Model Loader 是核心的 图像到视频扩散模型，专为从单张图像进行时序扩展以生成动态视频帧而设计。该模块加载 Wan2.1-14B-Fusionx_Image2Video 模型，并整合多项先进特性：

Temporal Fusion（时间融合）：将静态图像潜变量扩展为连贯的帧序列，生成自然的运动与电影级流畅度。
量化 (fp8_e5m2)：在保持整体质量的同时，优化内存占用并加速推理。
Torch Compile & BlockSwap：提升性能与内存效率，使更长的视频序列生成更加顺畅。

该模型充当核心引擎，将图像潜变量、文本语义与运动动态相融合，从而生成高质量的动画视频输出。

如何使用 FusionX#

必要输入#

使用 FusionX 时，你需要在 Prompt 输入中设置文字描述，以定义场景的内容与风格。同时，你可以选择加载一张图像作为参考基础（图像到视频的生成场景中为必需项）。这些输入对于生成符合 FusionX 要求的连贯且高质量视频序列至关重要。

可选输入与控制项#

你可以配置参数，如 Steps（步数）与 Shift（偏移），并设置种子（Seed）值以控制采样过程。通过调整 Width、Height 和 Number of Frames，可定制输出视频的分辨率与序列长度。此外，还可以调整每秒帧数（Frames Per Second）或选择输出格式（Output Format），以满足具体创作需求。

输出结果#

FusionX 输出的视频序列会严格遵循文本或图像提示内容。使用推荐设置时，你可获得如 1024x576 或 1080x720 的分辨率，以及流畅的帧率以呈现电影般观感。输出通过设置的 Output Format 以标准视频文件形式导出。

最佳实践#

使用 FusionX 时，建议将 Steps 参数保持在 6 至 10 之间，以平衡生成速度与画质；始终根据提供的设置保持 CFG 兼容性。根据分辨率调整 Shift 可获得最佳效果。若需更流畅的运动表现，可适当增加帧数（Number of Frames）并在最终导出前合理设置帧率（Frames Per Second）。

Related Playgrounds

wan-2-2/text-to-image

使用 Wan 2.2 轻松将文字转化为高质量图像，助力创意表达与视觉设计。

wan-2-2/vace-fun

快速将静态图像转化为流畅的视频动画，保持人物一致性与电影级动感效果。

happyhorse-1.0/reference-to-video

HappyHorse 1.0 参考视频将多达 9 个参考图像和提示融合成一个具有稳定身份的连贯多字符剪辑。

dreamina-3-0/pro/image-to-video

将静态图片快速生成高质量2K动态视频，精准还原创意细节，助力设计与视觉表达。

hunyuan/image-to-video

智能将静态图片转换为流畅视频，场景衔接自然，创作更轻松。

seedance-1-0/pro/fast/text-to-video

高效AI文本转视频工具，轻松将创意脚本变为生动影片，助力设计师快速呈现视觉故事。

常见问题

FusionX 是什么？它的作用是什么？

FusionX 是一款由 Runcomfy 提供的 AI 创作工具，集成在其 AI playground 中。它利用先进的机器学习模型，帮助用户轻松生成各种数字内容，是创作者们打造多媒体作品的高效利器。

使用 FusionX 是免费的，还是需要订阅？

FusionX 采用 Runcomfy.com 上的积分机制运作。新用户注册后可获得免费试用积分，但如果希望持续使用 FusionX 进行创作，则需要按照 '生成' 部分的说明购买额外积分。

FusionX 主要有哪些功能？

FusionX 拥有丰富的数字内容生成能力，兼顾多样性和操作便捷性。它支持多种输入格式，兼容移动浏览器，并可通过 Runcomfy 平台进行 AI 智能增强，为用户带来多场景创作支持。

FusionX 是为哪些人设计的？

FusionX 非常适合数字创作者、设计师、内容营销人员及 AI 爱好者使用，帮助他们高效生成优质媒体内容。它界面友好，既适合新手，也能满足专业人士的创作需求。

我可以在手机上使用 FusionX 吗？

可以，FusionX 可通过 Runcomfy 网站直接访问，并针对移动浏览器做了优化，不论身在何处都可以轻松开启创作。

我在 Runcomfy 注册后，如何开始使用 FusionX？

完成 Runcomfy.com 的注册后，登录账户并进入 AI playground 区域即可使用 FusionX。新用户可享有免费试用积分，之后如需继续使用，可根据需要购买更多积分。

FusionX 支持哪些媒体输入和输出格式？

FusionX 能处理多种数字媒体输入，并生成相应的内容。具体支持的输入输出类型会根据 AI playground 中不同工具的设置有所变化，建议根据实际需求灵活调整。

FusionX 和其他 AI 内容生成工具有什么不同？

FusionX 在 Runcomfy 平台中实现了无缝集成，具备用户参与反馈机制，同时能灵活应对各种创作场景，尤其针对移动端做了优化，给用户带来更流畅的使用体验。

FusionX 有哪些使用限制需要注意？

虽然 FusionX 功能强大，但它基于积分模式运作，部分内容生成可能受限于 AI 模型的能力。此外，Runcomfy 鼓励用户积极反馈，以持续优化 FusionX 的使用体验。

我该如何反馈使用 FusionX 中遇到的问题或建议？

若在使用 FusionX 过程中遇到问题或有改进建议，可通过 hi@runcomfy.com 联系开发团队。您提供的反馈对提升 Runcomfy 的 AI 工具体验至关重要。

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

FusionX：电影级AI图像转视频 | 图像到视频

FusionX 通过使用 Wan2.1-14B-Fusionx_Image2Video 模型与 NAG 引导融合，从文本提示或参考图像生成流畅且高质量的电影级视频。

FusionX 简介#