Если вы тренируете LoRA в Ostris AI Toolkit, то наверняка сталкивались с таким:
- Samples / Previews во время обучения в AI Toolkit выглядят отлично.
- Та же LoRA даёт другой результат при инференсе в ComfyUI, Diffusers или другом стеке.
В большинстве случаев LoRA не «сломана» — просто пайплайн инференса отличается от пайплайна превью.
Мелочи быстро складываются: точная версия базовой модели, семантика scheduler/steps, дефолты VAE/CLIP, правила “snapping” (округления) разрешения и даже как применяется LoRA (adapter vs merge/fuse, нюансы разных семейств).
Чтобы инференс в стиле AI Toolkit было легче воспроизвести, проверить и отладить, RunComfy публикует эталонную реализацию инференса для AI Toolkit LoRA как open source, на базе Hugging Face Diffusers.
GitHub: runcomfy-com/ai-toolkit-inference
Для чего нужен этот open‑source репозиторий
Используйте его, если хотите:
- Воспроизвести Samples/Previews AI Toolkit вне AI Toolkit (с той же логикой инференса)
- Отладить “drift” между превью обучения и инференсом, контролируя каждый элемент пайплайна
- Собрать свой сервис инференса (например, за API) на базе Diffusers
Если цель — просто “запустить LoRA и попасть в результаты Samples”, код читать необязательно: RunComfy также даёт такое же preview‑matching поведение через managed‑inference (Playground/API) и ComfyUI‑воркфлоу.
Что внутри репозитория
Проект сделан так, чтобы поведение AI Toolkit превью было аудируемым и воспроизводимым. Обычно там есть:
- Diffusers‑пайплайны под конкретные базовые модели (image, edit/control, video — зависит от семейства)
- YAML обучения AI Toolkit → настройки инференса (YAML как “контракт”)
- Загрузка и применение LoRA (adapter vs merge/fuse; особенности биндинга по семействам)
- Правила snapping/округления разрешения для совпадения с Samples/Previews
- Опционально: пример асинхронного сервера (например, FastAPI) для инференса за API
Как это связано с RunComfy Trainer Inference
RunComfy использует ту же идею preview‑matching:
- Зафиксировать точную версию/вариант базовой модели
- Согласовать дефолты инференса для конкретного семейства
- Сохранить то же поведение пайплайна, которое рисует Samples/Previews в обучении
Этот выровненный пайплайн можно использовать двумя удобными для разработчика способами:
- Playground / API (быстрая проверка + интеграция)
- ComfyUI (воркфлоу под каждую базовую модель — загрузите LoRA и получайте preview‑matching результат)
Гайды:
- Паритет Playground/API: AI Toolkit Inference: Get Results That Match Your Training Samples
- Preview‑match в ComfyUI: AI Toolkit Inference in ComfyUI: Get Results That Match Your Training Samples
- Отладка drift: AI Toolkit Preview vs Inference Mismatch
Ready to start training?
