[Хотите освоить генерацию арта всего за два дня?

Пройдите онлайн интенсив по Stable Diffusion от создателей Нейробазы. Сэкономьте несколько недель времени и узнайте все секреты профессионалов. Посмотрите программу и запишитесь прямо сейчас!](https://salebot.site/neuroweb_1?utmus=base)

Поверхностное объяснение

Stable Diffusion — это файл со странным расширением (.ckpt, от "checkpoint"), который весит около 5Gb. Представляет собой специальным образом обученную модель на мощнейших датасетах, таких как LAION-5B, где 5B - это пять миллиардов эстетически приятных изображений всего на свете.

Можно думать об этом как о «двигателе» автомобиля. Сам по себе это просто прекрасный образец инженерной мысли, но вам нужна остальная часть автомобиля (трансмиссия, колеса...), чтобы заставить его делать что-то действительно полезное, и вам нужен интерфейс (руль, педали), чтобы на самом деле быть в состоянии контролировать ситуацию.

Таким интерфейсом является, например, Automatic1111 Web UI или более экзотичный вариант Comfy UI, которые позволяют удобно взаимодействовать с мотором - моделью Stable Diffusion. Вы вводите запрос, отправляете на исполнение, движок запускается, рычит, и выдаёт конечное изображение.

Untitled

Чуть более детальное объяснение

Stable Diffusion — это модель, состоящая из множества компонентов. Это не единая монолитная система.

Внутри неё расположены три отдельных блока:

Untitled

Все эти блоки - отдельно обученные нейросети, объединённые компанией StabilityAI в одно целое для создания так называемой модели латентной диффузии - Stable Diffusion.

Что такое диффузия и почему она латентная?

Диффузионные модели – это системы машинного обучения, которые обучаются пошагово удалять случайный шум Гаусса, чтобы получить изображение.