Пройдите онлайн интенсив по Stable Diffusion от создателей Нейробазы. Сэкономьте несколько недель времени и узнайте все секреты профессионалов. Посмотрите программу и запишитесь прямо сейчас!](https://salebot.site/neuroweb_1?utmus=base)
Stable Diffusion — это файл со странным расширением (.ckpt, от "checkpoint"), который весит около 5Gb. Представляет собой специальным образом обученную модель на мощнейших датасетах, таких как LAION-5B, где 5B - это пять миллиардов эстетически приятных изображений всего на свете.
Можно думать об этом как о «двигателе» автомобиля. Сам по себе это просто прекрасный образец инженерной мысли, но вам нужна остальная часть автомобиля (трансмиссия, колеса...), чтобы заставить его делать что-то действительно полезное, и вам нужен интерфейс (руль, педали), чтобы на самом деле быть в состоянии контролировать ситуацию.
Таким интерфейсом является, например, Automatic1111 Web UI или более экзотичный вариант Comfy UI, которые позволяют удобно взаимодействовать с мотором - моделью Stable Diffusion. Вы вводите запрос, отправляете на исполнение, движок запускается, рычит, и выдаёт конечное изображение.
Stable Diffusion — это модель, состоящая из множества компонентов. Это не единая монолитная система.
Внутри неё расположены три отдельных блока:
Все эти блоки - отдельно обученные нейросети, объединённые компанией StabilityAI в одно целое для создания так называемой модели латентной диффузии - Stable Diffusion.
Что такое диффузия и почему она латентная?
Диффузионные модели – это системы машинного обучения, которые обучаются пошагово удалять случайный шум Гаусса, чтобы получить изображение.