Когда искусственный интеллект заменит дизайнеров? Изучаем нейросети и рассказываем, как генерировать изображения

Когда искусственный интеллект заменит дизайнеров? Изучаем нейросети и рассказываем, как генерировать изображения

2022 год стал годом графических нейросетей. Искусственный интеллект постоянно появляется в новостях, он генерирует картины, иллюстрации и комиксы. Дизайнеры серьезно начали переживать, что скоро они останутся без работы. Давайте разберемся, почему это не так, что на самом деле умеют и не умеют нейросети и как с ними сотрудничать.

Что уже умеет искусственный интеллект

Обложка журнала

В июне 2022 года на обложке журнала Cosmopolitan появилась девушка-астронавт, сгенерированная нейросетью Dall-e 2. 

обложка журнала Cosmopolitan  девушка в космосе
Обложка журнала Cosmopolitan. Июнь 2022 Источник

Редакторы журнала и сотрудники лаборатории OpenAI придумывали запросы, по которым нейросеть могла бы создать подходящую иллюстрацию для обложки. Варианты были необычными:

  • «Рука молодой женщины с лаком для ногтей держит космополитический коктейль»;
  • «Модная женщина крупным планом, режиссер Уэс Андерсон»;
  • «Женщина с серьгой — это портал в другую вселенную».

Но результаты по этим запросам показались редакторам слабыми, поэтому они сформулировали другой: «Сильная женщина-президент-космонавт-воин, идущая по планете Марс, цифровое искусство, синтвейв». Черновые варианты получились такими:

первые варианты обложки Cosmopolitan девушки в скафандрах сгенерированные нейросетью
Источник

После нескольких брейнштормов запрос скорректировали, и финальный арт Dall-e 2 сгенерировал по тексту: «Широкоугольный снимок снизу женщины-космонавта со спортивным телосложением, развязно идущей к камере на Марсе в бесконечной вселенной, цифровое искусство синтвейв». Это была первая в мире обложка крупного коммерческого журнала, созданная нейросетью.

Комикс

В августе 2022 года американский кинематографист Стив Коулсон выпустил хоррор-комикс «Summer Island» про мистический культ в маленькой шотландской деревне. Художником в этом проекте стала нейросеть Midjourney, она сгенерировала локации, персонажей и их пугающие костюмы.

черно белый комикс Summer Island лица в масках нарисованные нейросетью
Фрагмент комикса «Summer Island». Источник

Проект не сразу задумывался как комикс. Изначально Стив Коулсон пытался воссоздать в Midjourney имитацию настоящего фоторепортажа. Он задал нейросети определенный тип пленки Kodak, тип объектива камеры и соотношение сторон кадра. Получился вот такой результат:

дополнительные материалы к комиксу Summer Island изображения стилизованные под пленочное фото которое сгенерировала нейросеть
Источник

Тогда Стиву стало интересно, сможет ли он сделать из этого историю в совершенно другом визуальном стиле. Он хотел проверить возможности современных нейросетей и создать картинку, которая будет выглядеть как комикс, а не как «искусственный интеллект, пытающийся нарисовать комикс». В итоге у него получилась 40-страничная история фоторепортера, который случайно попал в жуткую деревню со странными обрядами.

Цифровое искусство

Диджитал-арт «Theatre d’Opera Spatial», сгенерированный с помощью нейросети Midjourney, по ошибке победил в конкурсе цифрового искусства. Художник Джейсон Аллен задал ИИ определенные параметры рисовки, а потом распечатал работу и отправил на конкурс. В описании он указал, что картина создана в Midjourney, но судьи конкурса, кажется, не поняли, что это искусственный интеллект.

картина Theatre d’Opera Spatial оперный зал сгенерированный с помощью нейросети Midjourney
Снимок работы вместе с наградой автор опубликовал в Discord. Источник

Как обучают нейросети

Искусственный интеллект, который создает изображения по запросам, обучается на большом количестве данных. Это миллионы изображений и подписей к ним. Например, нейросеть обрабатывает фотографии с подписью «коала» и запоминает, как выглядит это животное; то же самое будет с картинками, подписанными как «мотоцикл».

две базы данных которые загружаются в нейросеть изображения коал и изображения мотоциклов
Две базы данных, которые изучает нейросеть. Скриншот с официального сайта Dall-e 2

Кроме этого, в массиве данных есть картинки с подписью «человек едет на мотоцикле», на их примере нейросеть запоминает, как именно нужно сидеть за рулем. И по запросу «коала на мотоцикле» ИИ объединит все свои знания об этих объектах, чтобы создать собственную картинку.

объединение базы данных с изображениями коал и изображениями мотоциклов при обучении нейросети
Объединение баз данных при обучении нейросети. Скриншот с официального сайта Dall-e 2

В результате нейросеть выдаст множество изображений коал на разных мотоциклах, которых раньше не существовало.

результат работы нейросети по запросу коала на мотоцикле
Сгенерированные изображения по запросу «коала на мотоцикле». Скриншот с официального сайта Dall-e 2

Самые популярные нейросети

Dall-e 2

Эту нейросеть разработала компания OpenAI. Она выступает за доступность технологий искусственного интеллекта для всех людей, а не только для корпораций. Поэтому разработки OpenAI используют многие проекты с открытым исходным кодом.

Dall-e 2 раньше других нейросетей стала интернет-феноменом. В социальных сетях появлялись десятки сообществ, в которых пользователи выкладывали творчество нейросети по разным запросам.

«Средний план, фотография в redscale Давида Микеланджело в черных наушниках на темно-сером монохромном фоне»:

фотография Давида Микеланджело в черных наушниках на темно-сером монохромном фоне
Источник

«Осьминог, читающий газету»:

осьминог с газетой на голубом фоне
Источник

«Высокодетализированный винтажный портрет капибары в маскарадном костюме, курящей сигару, винтажная фотография 1920-х годов»:

изображение капибары в шляпе стилизованное под фотографию 1920-х годов
Источник

Такая популярность нейросети была связана с открытым бета-тестом, участие в котором принимали около миллиона пользователей. А в сентябре 2022 года компания открыла доступ для всех желающих, но для российских пользователей нейросеть пока недоступна. 

Интерфейс Dall-e 2 генерация изображений
Интерфейс Dall-e 2. Источник

Не все изображения Dall-e 2 генерируются бесплатно. Система рассчитывает оплату в кредитах: у новичков есть 50 кредитов — это примерно 200 изображений. Дополнительные попытки генерации можно купить за $15, это 115 кредитов или примерно 460 изображений.

Важно, что картинки, которые пользователь получил по своему запросу, он может использовать в коммерческих целях. Например, как иллюстрации на сайте или принты для футболок.

Midjourney

Midjourney разработала одноименная американская компания. Качество изображений у этой нейросети не хуже, чем у Dall-e 2. И пока Dall-e была в закрытом бета-тесте с ограниченным доступом, Midjourney оказалась доступнее для большинства пользователей и обогнала конкурентов по количеству упоминаний. 

Пользователи придумывали с нейросетью все более интересные проекты. Например, в Midjourney визуализировали финальный монолог репликанта из «Бегущего по лезвию»:

«Я видел такое, во что вы, люди, просто не поверите. Штурмовые корабли в огне на подступах к Ориону. Я смотрел, как Си-лучи мерцают во тьме близ врат Тангейзера. Все эти мгновения исчезнут во времени, как слезы под дождем. Пора умирать…»

В результате нейросеть сгенерировала вот такое изображение:

нейросеть визуализировала монолог репликанта из Бегущего по лезвию
Источник

Пользоваться нейросетью можно через Discord. Если у вас нет учетной записи в этом сервисе, ее нужно будет создать и потом присоединиться к серверу Midjourney. Там вы увидите несколько чатов, которые называются Newbies. Можно зайти в любой из них и отправлять запросы через строку ввода внизу:

чат Midjourney в Discord генерация изображений по запросам
Скриншот чата Newbies в Discord

Кроме вас в чате будут другие пользователи. Вы увидите, что генерируют они, а они будут видеть ваши запросы. В строке ввода сначала нужно будет ввести команду /imagine. В появившемся окне введите сам текст запроса. Лучше использовать английский, так как его Midjourney распознает качественнее других языков:

строка ввода для генерации изображений в Discord
Строка ввода для запросов. Скриншот чата Newbies в Discord

У новых пользователей есть 25 бесплатных генераций, дальше нужно будет покупать подписку. Проблема в том, что карты российских банков пока не поддерживаются, а без подписки нельзя использовать изображения Midjourney в коммерческих целях.

Stable Diffusion

Нейросеть от компании Stability.ai Stable Diffusion появилась недавно. Сервис Runway уже запустил на основе этой нейросети бесплатный видеоредактор, в котором можно править видео в реальном времени или создавать с нуля собственные видеоарты:

Генерация и редактирование видео в реальном времени. Источник

Изображения тоже можно генерировать. Stable Diffusion даже называют лучшей из существующих графических нейросетей с открытым исходным кодом. Например, так по мнению нейросети выглядят офисные будни, которые мог бы написать Сальвадор Дали:

изображение созданное с помощью нейросети офисные будни в стиле Сальвадора Дали черно белые
Изображение, сгенерированное Stable Diffusion
изображение созданное с помощью нейросети офисные будни в стиле Сальвадора Дали в цвете
Изображение, сгенерированное Stable Diffusion

Пользоваться Stable Diffusion можно разными способами. Самый сложный — это скачать с GitHub исходный код и запустить его на своем компьютере по инструкции. Такой вариант подойдет только тем, кто хоть немного разбирается в программировании, но зато он выдаст самые качественные результаты.

Более простая версия нейросети есть на сайте Dezgo, там даже не нужна регистрация для начала работы, можно сразу вводить запросы:

интерфейс сайта Dezgo генерация изображений по запросам
Скриншот сайта Dezgo

Stable Diffusion доступна для всех и бесплатна, а готовые картинки разрешено использовать в коммерческих целях.

Проблемы нейросетей

Долгое время правила нейросетей запрещали генерировать лица людей, потому что это грозило появлением огромного количества дипфейков, то есть поддельных фотографий, которые могли бы вводить в заблуждение или кому-то навредить. Из-за этого запрета у искусственного интеллекта большие проблемы при генерации картинок с людьми. Вот так выглядят изображения нейросети Stable Diffusion по запросу «счастливая девушка разговаривает по телефону»:

изображение созданное с помощью нейросети Stable Diffusion по запросу счастливая девушка разговаривает по телефону
Изображение, сгенерированное Stable Diffusion
изображение созданное с помощью нейросети Stable Diffusion по запросу счастливая девушка разговаривает по телефону
Изображение, сгенерированное Stable Diffusion

Иногда изображения получаются жутковатыми. Это касается не только фотореалистичных картинок, но и векторных иллюстраций. Например, вот такой результат выдала нейросеть Midjourney по запросу «векторная иллюстрация официант»:

изображение созданное с помощью нейросети Stable Diffusion по запросу векторная иллюстрация официант
Изображение, сгенерированное Midjourney

Еще одна проблема — сам процесс обучения. Нейросети могут выдавать некорректные результаты по запросам, если обучались на базе данных с ошибками. Например, где фотографии котов были подписаны как «корги» или самолет подписан как «машина». Это вводит нейросеть в заблуждение и она начинает путаться.

Когда искусственный интеллект заменит дизайнеров

В ближайшее время этого точно не случится. Несмотря на заметные достижения, нейросетям не хватает многих профессиональных черт. Дизайнеру требуются эмпатия и логическое мышление, чтобы создавать удобные и функциональные проекты: понятные сайты и интерфейсы, айдентику, которая передает ценности бренда, или комфортные интерьеры, в которых хочется находиться. А нейросеть пока не ориентируется на удобство для человека.

Но искусственный интеллект можно использовать как дополнительный инструмент. Например, он поможет преодолеть страх «белого листа», когда вы не знаете, с чего начать. Нейросеть сгенерирует по запросу несколько идей, от которых можно оттолкнуться, но не сделает за вас всю работу.

Дизайнеры интерфейсов могут поискать вдохновение для создания иконок. По теме «еда» нейросети предлагают вот такие варианты:

изображение созданное с помощью нейросети Midjourney по запросу иллюстрация с растениями
Иконки Midjourney
изображение созданное с помощью нейросети Stable Diffusion по запросу мобильные иконки еда
Иконки Stable Diffusion

Дизайнерам интерьеров можно генерировать идеи для первых интерьерных скетчей:

изображение созданное с помощью нейросети Midjourney по запросу иллюстрация с растениями
Скетч интерьера Midjourney
изображение созданное с помощью нейросети Stable Diffusion по запросу интерьерный скетч спальни
Скетч интерьера Stable Diffusion

А графические дизайнеры могут привлекать нейросети в качестве иллюстраторов:

изображение созданное с помощью нейросети Midjourney по запросу иллюстрация с людьми на пляже
Иллюстрации Midjourney в акварельном стиле
изображение созданное с помощью нейросети Stable Diffusion по запросу иллюстрация с растениями
Иллюстрации Stable Diffusion

Продюсер Кевин Гейгер в своем блоге на AWN говорит о том, что включение цифровых, а теперь и генеративных инструментов в рабочие процессы — это естественно. Тот факт, что любой может отправить фразу в генератор изображений, должен беспокоить художников не больше, чем возможность любого человека зайти в магазин художественных принадлежностей и купить кисти.

Медиа Contented
Добавить комментарий