LoRA vs Stable Diffusion: чем отличаются и что лучше

AI-фотосессия · 25 мая 2026 · 7 мин чтения

LoRA vs Stable Diffusion: чем отличаются и что лучше

Чем LoRA отличается от обычной Stable Diffusion, почему персональный портрет = LoRA, а не SD. Простое объяснение технологий для тех кто заказывает AI-фото.

Кратко. Stable Diffusion — это «базовая» нейросеть которая умеет рисовать что угодно по описанию, но не знает как выглядишь ты. LoRA — это маленькая «дообученная» модель твоего лица которая вставляется поверх Stable Diffusion. Без LoRA персональный портрет не получится — будет «лицо похожее на тебя на 30%».

Что такое Stable Diffusion

Stable Diffusion (SD) — это семейство больших нейросетей для генерации изображений по текстовому описанию. Обучены на миллиардах картинок из интернета. Знают как выглядит «человек», «парень», «улица», «костюм», «закат» — всё что часто встречается в сети.

Что SD может сама:

  • Нарисовать «парня в костюме в офисе»
  • Нарисовать «знаменитость» (если её много в датасете)
  • Нарисовать сцену, природу, объект

Что SD не может:

  • Нарисовать тебя — она тебя не знает
  • Стабильно держать одно и то же лицо в разных кадрах
  • Точно передать черты лица обычного человека

Что такое LoRA

LoRA (Low-Rank Adaptation) — это техника «дообучения» нейросети. Берётся базовая SD (большая, 5+ ГБ), и поверх неё обучается крохотная (~150 МБ) добавочная модель которая «учит» сеть новой концепции.

В случае персонального портрета LoRA обучают на 15-20 твоих селфи. На выходе — файл который при подключении к SD заставляет её рисовать именно твоё лицо.

Аналогия: SD — это художник который умеет рисовать всё, но тебя никогда не видел. LoRA — это альбом с 20 твоими фото, который художник за пару часов изучает. После изучения он может нарисовать тебя где угодно и в чём угодно.

Почему именно LoRA, а не «дообучить саму SD»

Технически можно дообучить и саму Stable Diffusion (это называется fine-tuning). Но это:

  • Очень долго (часы-дни на хорошем GPU)
  • Очень дорого (тонна вычислений)
  • Результат — файл на 5+ ГБ который нельзя «переключать»

LoRA — это «лайт-версия» того же. Обучается за 20-30 минут, весит 150 МБ, можно подключать к разным базам, можно держать несколько LoRA одновременно (твоё лицо + стиль аниме + конкретная одежда — всё вместе).

Как это работает в AI-фотосессии

  1. Ты загружаешь 15-20 селфи
  2. Сервис запускает обучение LoRA на твоих лицах (20-30 мин)
  3. Получается файл «твоя личная LoRA»
  4. Сервис подключает эту LoRA к Stable Diffusion (точнее обычно к Flux — современной версии SD)
  5. Прописывает промпт типа «ohwx person in a leather jacket in a Tokyo street, neon lights, cinematic photo»
  6. SD + LoRA рисуют именно тебя в этой сцене
  7. Повторить 60 раз с разными промптами — получаешь фотосет

Если убрать LoRA из этой схемы — будет рандомный парень. Если убрать SD — LoRA просто не сработает (это «добавка», ей нужна база).

Чем LoRA отличается от FaceSwap

FaceSwap — это другая техника: берётся готовая картинка и на неё «приклеивается» лицо. Получается плоско, неестественно, видны швы, не работает с углом съёмки.

LoRA генерирует новое лицо с нуля каждый раз, в правильной позе, с правильным освещением, с правильным углом. Поэтому AI-фотосессия выглядит как реальная съёмка, а не как Photoshop-склейка.

Чем LoRA отличается от Nano Banana / Gemini Image

Nano Banana (Gemini 3 Pro Image) — другая нейросеть Google, умеет работать в режиме image-to-image edit: ей даёшь готовую фото-локацию и просишь «поставь сюда вот этого человека» (3 референса лица). Она генерирует один кадр.

Отличия:

  • LoRA нужно сначала обучить (20 мин), потом гонять (1 сек на фото)
  • Nano Banana работает сразу без обучения, но каждый кадр медленнее (~30 сек)
  • LoRA лучше сохраняет identity в разных стилях
  • Nano Banana лучше работает с конкретными локациями (фон точно как в референсе)

В качественных сервисах используются оба: LoRA для стилей из каталога (быстро, много), Nano Banana — для конкретных локаций (медленнее, но точно).

FAQ

Можно ли запустить LoRA дома

Да, если у тебя GPU с 12+ ГБ видеопамяти (RTX 3060 12GB или выше). Через AUTOMATIC1111, ComfyUI или Kohya_ss. Обучение LoRA на лице — 30-60 минут на 3060, генерация — 2-5 секунд на кадр. Минус: нужен софт-tech-стек, время на разбор.

Почему LoRA называется «Low-Rank Adaptation»

Технический термин. Нейросеть состоит из матриц весов. Полное обучение меняет все веса. LoRA меняет только «низкоранговую» часть — небольшое подмножество. Это позволяет резко уменьшить размер файла и время обучения, почти не теряя качество.

Сколько весит LoRA модель моего лица

Обычно 100-200 МБ. Это нормальный «вес» персональной LoRA. Для сравнения базовая Stable Diffusion XL весит 6+ ГБ, Flux — 12 ГБ.

Если у меня есть LoRA — могу ли я генерировать сам

Технически да, если умеешь работать с AUTOMATIC1111/ComfyUI. Большинство сервисов LoRA-файл наружу не отдают. Если очень нужен — спрашивай у сервиса.

← AI-фотосессия в России: как работает
Чек-лист 20 селфи для AI →

Обновлено: 25 мая 2026

Готов попробовать?

Превью бесплатно — за минуту увидишь как будет выглядеть твой фотосет. Без оплаты карты вперёд.

Получить бесплатное превью →

Читать дальше