AI-фотосессия · 25 мая 2026 · 7 мин чтения
LoRA vs Stable Diffusion: чем отличаются и что лучше
Чем LoRA отличается от обычной Stable Diffusion, почему персональный портрет = LoRA, а не SD. Простое объяснение технологий для тех кто заказывает AI-фото.
Кратко. Stable Diffusion — это «базовая» нейросеть которая умеет рисовать что угодно по описанию, но не знает как выглядишь ты. LoRA — это маленькая «дообученная» модель твоего лица которая вставляется поверх Stable Diffusion. Без LoRA персональный портрет не получится — будет «лицо похожее на тебя на 30%».
Что такое Stable Diffusion
Stable Diffusion (SD) — это семейство больших нейросетей для генерации изображений по текстовому описанию. Обучены на миллиардах картинок из интернета. Знают как выглядит «человек», «парень», «улица», «костюм», «закат» — всё что часто встречается в сети.
Что SD может сама:
- Нарисовать «парня в костюме в офисе»
- Нарисовать «знаменитость» (если её много в датасете)
- Нарисовать сцену, природу, объект
Что SD не может:
- Нарисовать тебя — она тебя не знает
- Стабильно держать одно и то же лицо в разных кадрах
- Точно передать черты лица обычного человека
Что такое LoRA
LoRA (Low-Rank Adaptation) — это техника «дообучения» нейросети. Берётся базовая SD (большая, 5+ ГБ), и поверх неё обучается крохотная (~150 МБ) добавочная модель которая «учит» сеть новой концепции.
В случае персонального портрета LoRA обучают на 15-20 твоих селфи. На выходе — файл который при подключении к SD заставляет её рисовать именно твоё лицо.
Аналогия: SD — это художник который умеет рисовать всё, но тебя никогда не видел. LoRA — это альбом с 20 твоими фото, который художник за пару часов изучает. После изучения он может нарисовать тебя где угодно и в чём угодно.
Почему именно LoRA, а не «дообучить саму SD»
Технически можно дообучить и саму Stable Diffusion (это называется fine-tuning). Но это:
- Очень долго (часы-дни на хорошем GPU)
- Очень дорого (тонна вычислений)
- Результат — файл на 5+ ГБ который нельзя «переключать»
LoRA — это «лайт-версия» того же. Обучается за 20-30 минут, весит 150 МБ, можно подключать к разным базам, можно держать несколько LoRA одновременно (твоё лицо + стиль аниме + конкретная одежда — всё вместе).
Как это работает в AI-фотосессии
- Ты загружаешь 15-20 селфи
- Сервис запускает обучение LoRA на твоих лицах (20-30 мин)
- Получается файл «твоя личная LoRA»
- Сервис подключает эту LoRA к Stable Diffusion (точнее обычно к Flux — современной версии SD)
- Прописывает промпт типа «ohwx person in a leather jacket in a Tokyo street, neon lights, cinematic photo»
- SD + LoRA рисуют именно тебя в этой сцене
- Повторить 60 раз с разными промптами — получаешь фотосет
Если убрать LoRA из этой схемы — будет рандомный парень. Если убрать SD — LoRA просто не сработает (это «добавка», ей нужна база).
Чем LoRA отличается от FaceSwap
FaceSwap — это другая техника: берётся готовая картинка и на неё «приклеивается» лицо. Получается плоско, неестественно, видны швы, не работает с углом съёмки.
LoRA генерирует новое лицо с нуля каждый раз, в правильной позе, с правильным освещением, с правильным углом. Поэтому AI-фотосессия выглядит как реальная съёмка, а не как Photoshop-склейка.
Чем LoRA отличается от Nano Banana / Gemini Image
Nano Banana (Gemini 3 Pro Image) — другая нейросеть Google, умеет работать в режиме image-to-image edit: ей даёшь готовую фото-локацию и просишь «поставь сюда вот этого человека» (3 референса лица). Она генерирует один кадр.
Отличия:
- LoRA нужно сначала обучить (20 мин), потом гонять (1 сек на фото)
- Nano Banana работает сразу без обучения, но каждый кадр медленнее (~30 сек)
- LoRA лучше сохраняет identity в разных стилях
- Nano Banana лучше работает с конкретными локациями (фон точно как в референсе)
В качественных сервисах используются оба: LoRA для стилей из каталога (быстро, много), Nano Banana — для конкретных локаций (медленнее, но точно).
FAQ
Можно ли запустить LoRA дома
Да, если у тебя GPU с 12+ ГБ видеопамяти (RTX 3060 12GB или выше). Через AUTOMATIC1111, ComfyUI или Kohya_ss. Обучение LoRA на лице — 30-60 минут на 3060, генерация — 2-5 секунд на кадр. Минус: нужен софт-tech-стек, время на разбор.
Почему LoRA называется «Low-Rank Adaptation»
Технический термин. Нейросеть состоит из матриц весов. Полное обучение меняет все веса. LoRA меняет только «низкоранговую» часть — небольшое подмножество. Это позволяет резко уменьшить размер файла и время обучения, почти не теряя качество.
Сколько весит LoRA модель моего лица
Обычно 100-200 МБ. Это нормальный «вес» персональной LoRA. Для сравнения базовая Stable Diffusion XL весит 6+ ГБ, Flux — 12 ГБ.
Если у меня есть LoRA — могу ли я генерировать сам
Технически да, если умеешь работать с AUTOMATIC1111/ComfyUI. Большинство сервисов LoRA-файл наружу не отдают. Если очень нужен — спрашивай у сервиса.
← AI-фотосессия в России: как работает
Чек-лист 20 селфи для AI →
Обновлено: 25 мая 2026
Готов попробовать?
Превью бесплатно — за минуту увидишь как будет выглядеть твой фотосет. Без оплаты карты вперёд.
Получить бесплатное превью →Читать дальше
AI-фотосессия · 16 мин
AI-фотосессия в России: как работает и сколько стоит
Pillar-статья кластера AI-фото. Технология, цены 2026, сравнение с фотографом, юридический контекст. Все цифры со ссылками на исследования.
AI-фотосессия · 10 мин
Топ-7 AI-сервисов для фотосессии в России 2026
Сравнение 7 сервисов одной таблицей: цена, доступность для РФ-карт, технология. Какой выбрать под свой кейс.
AI-фотосессия · 9 мин
Чек-лист 20 селфи для AI-фотосессии: что снять и как
20 разных селфи решают качество результата. Чек-лист по ракурсам, свету, мимике — за 15 минут на телефоне.
