fantasy-portrait/image-to-video

fantasy-portrait/image-to-video

Controls how strongly the Fantasy Portrait embedding influences the video generation, higher emphasizes the portrait and expressions.
Number of denoising iterations; more steps refine detail and stability but take longer.
Controls how strongly the output adheres to the prompt versus allowing creative variation.
Offsets the diffusion sampling schedule, trading stability for stronger motion/style as the value increases.

Fantasy Portrait 簡介

本版本讓您能夠使用來自 Fantasy-AMAP 的 FantasyPortrait 模型,結合 Wan 2.1 以及可選的輕量 LoRA,將靜態影像轉化為具備電影質感的 Fantasy Portrait 動畫。系統在保留人物識別特徵的同時,展現細膩的表情細節,生成富含情感的影片片段,特別適合希望從單張肖像中創造電影級動態效果的創作者使用。

Fantasy Portrait 能夠將靜態影像轉化為充滿動感且保留原貌的動畫。此工具非常適合創作者、藝術家與故事講述者,能從一張肖像照片及影片中生成自然流暢的動態片段。輸出為高保真度的 MP4 影片,擁有穩定的構圖與精緻的電影級品質。

Fantasy Portrait 的核心模型

FantasyPortrait (Fantasy-AMAP)

FantasyPortrait 模型提供以人物識別與表情感知為核心的嵌入特徵,確保主體特徵得以保留,同時允許呈現細微的臉部動作。此模型是 Fantasy Portrait 工作流程的核心。您可透過 GitHub 專案 以及對應的 arXiv 論文 了解更多詳細內容。

WanVideo 2.1 I2V (14B, 720p)

WanVideo 2.1 作為影片擴散模型的主幹,能夠從肖像與提示引導中生成高解析度動畫。它同時利用影像與文字條件進行影片內容取樣,產出穩定且具表現力的結果。量化版與可供 Comfy 使用的權重已可於 Kijai 的 Hugging Face 模型包 取得。

如何使用 Fantasy Portrait

必要輸入項目

您需先透過圖片與影片輸入欄提供一張影像與一段影片,作為 Fantasy Portrait 生成的基礎。設定輸出寬度(Width)與高度(Height)以確定輸出尺寸,並使用影格數(Number of Frames)控制動畫持續時間。這些輸入是確保構圖一致與動畫長度正確的關鍵要素。

可選輸入與控制項

您可透過在 Prompt 中加入簡短描述性語句,來引導輸出影像的藝術風格或情感氛圍。如有需要,可調整 Seed 以改變生成時的隨機性、Shift 以控制動作時間、以及 Steps 以提高清晰度和取樣精度。這些可選控制項能幫助您在保持主體特徵的同時,嘗試不同的風格變化。

輸出結果

整個工作流程最終產生高品質的 MP4 影片,預設為 16 fps 與 yuv420p 格式(根據 Readme 描述)。輸出結果由您的原始肖像結合嵌入特徵與提示內容生成,展現出電影感與豐富表情的動態效果。最終成果是一段精緻的 Fantasy Portrait 動畫片段。

最佳實踐

為獲得最佳結果,請使用乾淨、光線良好的肖像照片作為輸入起點。影片素材應包含預期的動作內容。保持 Prompt 簡潔,重點放在氛圍或光影表現,而非人物特徵細節。適度調整 Steps 可提升畫面銳利度,而簡潔的提示詞則有助於維持表情的自然感。請始終確認 Width、Height 與 Number of Frames 與您預期的構圖與時長一致。

markdown Copy code

Related Playgrounds