[Хотите освоить генерацию арта всего за два дня?

Пройдите онлайн интенсив по Stable Diffusion от создателей Нейробазы. Сэкономьте несколько недель времени и узнайте все секреты профессионалов. Посмотрите программу и запишитесь прямо сейчас!](https://salebot.site/neuroweb_1?utmus=base)

Модели

Модель, иногда называемая "контрольной точкой" (из-за исторической тенденции выпуска моделей с использованием файлов контрольных точек 'ckpt' - python pickle), - это большой основной файл, используемый Stable Diffusion. Он содержит все данные, необходимые ИИ для работы, кроме кода обработки.

StabilityAI потратила миллионы долларов на обучение совершенно новой модели с нуля в SD 1.x. Другие релизы, особенно выпущенные другими организациями, начинали с модели Stability и добавляли в нее больше обучающих данных.

Обучение проходит в форме "родного" обучения (создание новых моделей или внесение в них дополнений), тонкой настройки (похоже на "родное" обучение, но с акцентом на улучшение деталей или добавление некоторых новых концепций) и DreamBooth (добавление одной концепции или небольшого числа концепций способом, который выполняется очень быстро, но может повредить другие части модели, кроме основы).

Файлы моделей содержат несколько гигабайт данных (около 2 Гб для файлов fp16, 4 Гб для файлов fp32 и 7 Гб для оригинальных релизов, содержащих дополнительные данные).

FP32 и FP16 в значительной степени эквивалентны, с небольшой потерей точности для FP16, с тем преимуществом, что требуется в два раза меньше места в файлах. В большинстве случаев вам нужна версия модели FP16. Дополнительная точность FP32 наиболее полезна для обучения.

Основным компонентом модели является UNet - часть ИИ, которая обрабатывает шаги диффузии.

Он также содержит данные для кодировщика текста и VAE.

Модели, доступные для загрузки онлайн, включают в себя варианты с родным обучением (SD1.x, SD2.x, NAI, WD, ...), тонко настроенные модели, пользовательские модели DreamBooth (существует множество моделей, которые обучают ИИ различным стилям или определенным концепциям, некоторые популярные примеры включают "EldenRingDiffusion", который обучает ИИ стилям игры 'Elden Ring', "HassanBlend", который обучает ИИ концепциям NSFW, ...), объединенные модели (объединенная модель содержит данные из нескольких различных других моделей, например, можно иметь 50% WD и 50% SD для смешения аниме и реалистичных стилей).

Файлы checkpoints - это "pickles", то есть они содержат исполняемый код на языке python. Теоретически это может быть использовано во вредоносных целях. Будьте осторожны, скачивая файлы с расширениями ".ckpt" или ".pt" из неизвестных источников.

По этой причине рекомендуется скачивать модели с расширением ".safetensors". Эти файлы содержат только данные модели, в них нет места для внедрения кода.

Если вы хотите использовать модель из сомнительного источника, но доступен только файл "ckpt", попросите автора выложить версию "safetensors".

Обратите внимание, что официальные модели SD бывают как "EMA", так и "nonEMA". "EMA" означает "экспоненциальное скользящее среднее" и является способом компенсации проблемы обучения ИИ, когда ИИ переоценивает последние несколько изображений, которые он видит. При выборе между EMA и nonEMA, вам в основном нужна версия EMA. Версия без EMA полезна (но даже не обязательна), только если вы собираетесь продолжать обучение модели дальше. Это вызывает путаницу, поскольку некоторые старые модели имели названия типа "full-ema", где "full" означало "также включающий non-ema", а другая модель вообще не упоминала "ema", но на самом деле была версией только EMA, т.е. предпочтительной версией.