Генерация изображений в Телеграм с помощью ИИ

Использование искусственного интеллекта (ИИ) для создания изображений – занятие далеко не тривиальное. Получить от нейросети сразу приемлемый результат, как правило, никогда не удаётся. Рассмотрим пример.

В мессенджере Телеграм есть боты, с помощью которых, используя ИИ, можно генерировать текст и картинки. Воспользуемся одним из таких ботов для генерации текста и зададим запрос (промпт): “Нарисуй девушку, играющую на скрипке”.

Получаем ответ:

К сожалению, я не могу создавать изображения или рисунки, но могу помочь вам описать, как можно изобразить девушку, играющую на скрипке. Представьте сцену: девушка с длинными волосами, одетая в элегантное платье, стоит в легком профильном положении. Ее левая рука держит скрипку, а правая — смычок, который касается струн. Ее лицо выражает сосредоточенность и наслаждение музыкой. На фоне можно нарисовать мягкий свет, который создает атмосферу уюта.

Отлично. Используем полученный ответ в качестве запроса для создания картинки, но уже в другой нейросети, генерирующей картинки:

#image. Нарисуй девушку с длинными волосами, одетую в элегантное платье, стоит в легком профильном положении. Ее левая рука держит скрипку, а правая — смычок, который касается струн. Ее лицо выражает сосредоточенность и наслаждение музыкой. На фоне можно нарисовать мягкий свет, который создает атмосферу уюта.

Нейросеть сама переводит этот запрос на английский.

Flux промпт: Draw a girl with long hair, dressed in an elegant dress, standing in a slight profile position. Her left hand holds a violin, and her right hand holds a bow touching the strings. Her face shows concentration and enjoyment of the music. In the background, you can draw soft light creating a cozy atmosphere.

Далее в качестве ответа нейросеть рисует картинку (рис. 1). Итак, нейросеть выполнила запрос и нарисовала картинку, но эта картинка, мягко говоря, весьма далека от совершенства. Получить сходу приемлемый результат, как и следовало ожидать, не удалось.

Рис. 1. Девушка со скрипкой. Неудачный промпт.

Продолжим работу над картинкой. Правая рука девушки на картинке держит скрипку, а не смычок. Это является следствием нечеткой формулировки промпта. Немного модернизируем промпт и запишем более четкие указания для правой руки девушки. Уточнённый промпт выглядит так:

#image. Нарисуй девушку с длинными волосами, одетую в элегантное платье, которая стоит в легком профильном положении. Ее левая рука держит скрипку, а правая рука держит смычок, который касается струн скрипки. Ее лицо выражает сосредоточенность и наслаждение музыкой. На фоне можно нарисовать мягкий свет, который создает атмосферу уюта.

Перевод промпта выглядит так:

Flux промпт: Draw a girl with long hair, dressed in an elegant dress, standing in a slight profile position Her left hand holds a violin, and her right hand holds a bow that touches the strings of the violin Her face expresses concentration and enjoyment of the music in the background, you can draw soft light that creates a cozy atmosphere.

Нейросеть нарисовала девушку, представленную на рис. 2

Рис. 2. Девушка со скрипкой. Уточненный промпт.

Уже гораздо лучше, уже почти то, что надо, но девушка должна подбородком прижимать скрипку к плечу. Давайте попробуем улучшить картинку. Для этого воспользуемся телеграм-ботом для нейросети Midjourney (https://t.me/midjorobot/?start=bQvTwk_MidjoRobot) По указанной в скобках ссылке открываем телеграм-бота и записываем наш промпт:

Нарисуй девушку с длинными волосами, одетую в элегантное платье, которая стоит в легком профильном положении. Ее левая рука держит скрипку, а правая рука держит смычок, который касается струн скрипки. Ее лицо выражает сосредоточенность и наслаждение музыкой. На фоне можно нарисовать мягкий свет, который создает атмосферу уюта.

Бот автоматически переводит промпт на английский и выдает 4 картинки (рис. 3):

Рис. 3. Девушка со скрипкой. Создано Midjourney

Мне нравится левая нижняя картинка. На ней руки девушки более естественно держат скрипку и смычок. Бесплатно можно сгенерировать очень ограниченное количество картинок. Но можно недорого купить платные генерации. Выгоднее всего покупать подписку на месяц за 390 руб. (рис. 4), которая позволяет генерировать 5 изображений в день.

Рис. 4. Стоимость платных генераций изображений

В итоге получили картинку, которая выглядит, как художественное произведение.