Полное руководство по написанию подсказок для Midjourney (text to image)

С правильными подсказками GPT-4 достигает безупречной производительности в тестах Theory of Mind.

Философская теория может объяснить, как большая языковая модель обучается «чтению мыслей».

Запрос: beautiful, fantastic city, unreal engine.
Изображение создано telegram ботом Midjourney Kolersky
Если вы еще не знакомы с midjourney, то представляем вам краткое описание: это приложение, которое позволяет преобразовать текст в изображение, подобное DreamStudio и DALLE-2 от Stable Diffusion и OpenAI соответственно. Оно использует более 650 миллионов изображений из Интернета для создания великолепных картинок на основе вашей подсказки. В настоящее время midjourney находится на стадии активного развития и его функционал постоянно обновляется, и мы можем только предполагать, что нас ждет в будущем! Текущая версия движка AI - v5.1.

Здесь же мы будем тестировать на более старых движках - версии 3 и 4. Чтобы достичь мастерства, нужно научиться работать с несовершенными инструментами=)


Необработанный текст подсказки

Любой, кто использовал Midjourney , знает, что чем более описательным будет ваш текст, тем более ярким и уникальным будет результат. Пользователи обычно используют необработанные и прямые подсказки, такие как: «ковбой в смокинге на луне», что будет генерировать что-то вроде этого:


Запрос: ковбой в смокинге на Луне ( cowboy in a tuxedo on the moon).
Напоминаю, это версия модели номер 3! Сейчас даже такие базовые запросы выдают более мощные картинки.

Но есть в MJ гораздо больше возможностей, чем просто обработка простого текста, для создания предсказуемых и согласованных выходных изображений!

Теперь перейдем непосредственно к списку дополнительных параметров для текстовых подсказок!

Вот некоторые из способов создания вариаций изображений и некоторые дополнительные настройки для них:
(подробности о каждой из этих настроек следуют за списком)

  1. Предоставление ключевых слов — «стиль»
  2. Стилизация
  3. Хаос
  4. Разрешение
  5. Соотношение сторон
  6. Передача изображения в качестве URL-адреса
  7. Применение веса к подсказкам изображения
  8. Вес к каждому слову подсказки
  9. Фильтрация слов
Короче говоря, на ваш стиль влияют выбранные вами ключевые слова, и вы можете указать, какие стили вы выберете. На этом рисунке показана широкая классификация типов стилей.
Группы стиля в пути
  1. Стиль — ключевое слово
Предоставление набора вспомогательных ключевых слов подсказки, связанных со « стилями» , может создавать различные результаты в зависимости от того, какой стиль вы решите выбрать. Вот некоторые ключевые слова и подтипы, основанные на художественной форме/дизайне/исполнителе/жанре, которые вы можете выбрать в качестве стилей:

  • использование дизайна/жанра в качестве стиля

Изображение создано Midjourney KolerskyAi, подсказки автора
  • использование имени исполнителя в качестве стиля
Вы также можете указать исполнителя в качестве выходного стиля. Некоторые примеры того же приглашения показаны ниже.

/imagine horse galloping at sunset painting Andy Warhol style
Изображение создано Midjourney KolerskyAi, подсказки автора
  • использование свойств рендеринга/освещения в качестве стиля
2. Cтилизация вывода
Вы можете добавить настройку --s <some number>(обозначающую стиль)

Следующие изображения взяты из тех же подсказок — с низким и высоким параметром стилизации.

/imagine firefighters --s 6000
3. Хаос — увеличить абстракцию
Введите значение от 0 до 100, чтобы увеличить или уменьшить уровень абстракции в предмете

/imagine Eiffel tower --chaos 60
4. Разрешение
Чтобы указать выходное разрешение, вы можете использовать некоторые из обычных ключевых слов, таких как 8K, 4K, фотореалистичный, ультрафотореалистичный, сверхдетальный, сложные детали и т. д .

Или можно пойти со стандартными настройками для предсказуемых выходов hd and quality / --q есть две такие настройки:
/imagine red rose flower --hd
/imagine red rose flower --quality 5

5. Соотношение сторон
Вы можете указать соотношение ширины и длины выходного изображения. Это называется соотношением сторон. Выход по умолчанию — квадратное изображение (соотношение сторон 1:1). Но если вам нужен более кинематографический вид — или вы просто хотите сделать обои для своего ноутбука, вы можете изменить соотношение сторон:
/imagine jasmine in the wild flower --ar 4:3

Если вы хотите указать пользовательский размер изображения, используйте следующий пример:
/imagine jasmine in the wild flower --w 600 --h 300

- Вы не можете указать свои собственные соотношения сторон, но можете указать некоторые стандартные соотношения и некоторые нестандартные! ( Ниже некоторые примеры)

Различные варианты пропорций для вывода Midjourney
6. Изображение как подсказка

Если вы хотите получить некоторые выходные данные, похожие на стиль изображения (когда вы хотите получить согласованные выходные данные) для нескольких изображений, отправьте в MJ URL-адрес изображения
/imagine http://www.imgur.com/Im3424.jpg box full of chocolates

Сгенерированное изображение будет получать реплики как из начального изображения (из переданного вами URL-адреса), так и из текстовых подсказок.

- Вы можете дать несколько изображений в качестве подсказок
- Вы можете указать вес изображения (см. следующий пункт)

7. Подсказка «Веса для изображения»
Если вы хотите, чтобы ваш вывод больше походил на изображение подсказки (см. предыдущий пункт), придайте этому изображению более высокий вес ( keyword : --iw <number>).

/imagine chocolates --iw:4

8. Вес к каждому элементу текста
/imagine wild animals tiger::2 zebra::4 lions::1.5

9. Фильтрация слов

Используйте --no
Это ключевое слово, чтобы убрать любые нежелательные предметы, появляющиеся в вашем изображении.
/imagine KFC fried chicken --no sauce

Различные варианты пропорций для вывода Midjourney
10. Наконец, несколько интересных ключевых слов, которые вы можете попробовать использовать
* Sony Alpha α7, ISO1900, Leica M, = указать любой тип объектива или тип камеры

*фотореалистичный, ультрафотореалистичный, ультрадетализированный, сложные детали, = указать некоторые возможные детали и реалистичный вид и менее художественный

* unreal = указать нереальное ощущение движения

* объемный свет, кинематографическое освещение = указать некоторые условия освещения
В итоге

Мы говорили о том, как вы можете получить некоторую степень контроля над тем, какие образы вы можете получить в качестве выходных данных для своих экспериментов на полпути.

Но это еще не совсем сделано. Хорошие ребята из Midjourney оставили много места для вашего воображения и экспериментов. Удачи вам в опробовании различных подсказок и получайте удовольствие от своих творений.

Как зайти в Midjourney?
Вы можете пользоваться Midjourney через телеграм-бота KoleskyAi
Проекты с нейросетями

ChatGPT | GPT-4 | Dall-e | Midjourney | Whisper | Фоторедактор | Stable Diffusion