Краткий ликбез к правильному написанию запросов

Краткий ликбез к правильному написанию запросов

Умение писать запрос не кажется сложной задачей, так как даже набрав абракадабру, можно получить красивую картинку. Случайно. Но написать запрос, чтобы получить требуемое - это на грани искусства, для этого нужен и опыт, и насмотренность, и знание основ промтостроения. О последнем мы сейчас и поговорим.

Что такое токен

Токенами называют слова или знаки, то есть cat это токен, , внезапно тоже токен.

Обратите внимание, что токены не являются теми же словами. Используемая CLIP-модель автоматически преобразует ключевое слово в токены - числовое представление известных слов. Если вы вводите слово, которое ему неизвестно, оно будет разбито на 2 или более подслова, пока он не узнает, что это. Известные ему слова называются токенами, которые представлены в виде чисел. Например home - это токен, и work - токен, а homework - это уже 2 предыдущих токена, так как модель не знает значения данного слова.

Какой длины должен быть запрос

Изначально в модели CLIP существует ограничение на 75 токенов. Но AUTOMATIC1111 обошёл это ограничение. Если запрос содержит более 75 токенов, запустится отдельно новый контейнер под еще 75 токенов, и новый «предел» станет равной 150. Процесс может продолжаться бесконечно до тех пор, пока в вашем компьютере не закончит память.

Каждый контейнер из 75 токенов обрабатывается независимо, и полученные представления объединяются перед загрузкой в модель Stable Diffusion.

В AUTOMATIC1111 вы можете проверить количество токенов, посмотрев на индикатор в правом верхнем углу поля ввода промпта.

https://i0.wp.com/stable-diffusion-art.com/wp-content/uploads/2023/02/image-23.png?resize=404%2C225&ssl=1

При этом стоит помнить об одной особенности: из-за ограничений в 75 токенов всё что не влезло в этот предел - будет обрезаться до ближайшей запятой. Например в предложении из 80 токенов 5 и более токенов просто исчезнут и не будут влиять на генерацию.

Какие токены использовать