Что уже умеет искусственный интеллект
Обложка журнала
В июне 2022 года на обложке журнала Cosmopolitan появилась девушка-астронавт, сгенерированная нейросетью Dall-e 2.
Редакторы журнала и сотрудники лаборатории OpenAI придумывали запросы, по которым нейросеть могла бы создать подходящую иллюстрацию для обложки. Варианты были необычными:
- «Рука молодой женщины с лаком для ногтей держит космополитический коктейль»;
- «Модная женщина крупным планом, режиссер Уэс Андерсон»;
- «Женщина с серьгой — это портал в другую вселенную».
Но результаты по этим запросам показались редакторам слабыми, поэтому они сформулировали другой: «Сильная женщина-президент-космонавт-воин, идущая по планете Марс, цифровое искусство, синтвейв». Черновые варианты получились такими:
После нескольких брейнштормов запрос скорректировали, и финальный арт Dall-e 2 сгенерировал по тексту: «Широкоугольный снимок снизу женщины-космонавта со спортивным телосложением, развязно идущей к камере на Марсе в бесконечной вселенной, цифровое искусство синтвейв». Это была первая в мире обложка крупного коммерческого журнала, созданная нейросетью.
Комикс
В августе 2022 года американский кинематографист Стив Коулсон выпустил хоррор-комикс «Summer Island» про мистический культ в маленькой шотландской деревне. Художником в этом проекте стала нейросеть Midjourney, она сгенерировала локации, персонажей и их пугающие костюмы.
Проект не сразу задумывался как комикс. Изначально Стив Коулсон пытался воссоздать в Midjourney имитацию настоящего фоторепортажа. Он задал нейросети определенный тип пленки Kodak, тип объектива камеры и соотношение сторон кадра. Получился вот такой результат:
Тогда Стиву стало интересно, сможет ли он сделать из этого историю в совершенно другом визуальном стиле. Он хотел проверить возможности современных нейросетей и создать картинку, которая будет выглядеть как комикс, а не как «искусственный интеллект, пытающийся нарисовать комикс». В итоге у него получилась 40-страничная история фоторепортера, который случайно попал в жуткую деревню со странными обрядами.
Цифровое искусство
Диджитал-арт «Theatre d’Opera Spatial», сгенерированный с помощью нейросети Midjourney, по ошибке победил в конкурсе цифрового искусства. Художник Джейсон Аллен задал ИИ определенные параметры рисовки, а потом распечатал работу и отправил на конкурс. В описании он указал, что картина создана в Midjourney, но судьи конкурса, кажется, не поняли, что это искусственный интеллект.
Как обучают нейросети
Искусственный интеллект, который создает изображения по запросам, обучается на большом количестве данных. Это миллионы изображений и подписей к ним. Например, нейросеть обрабатывает фотографии с подписью «коала» и запоминает, как выглядит это животное; то же самое будет с картинками, подписанными как «мотоцикл».
Кроме этого, в массиве данных есть картинки с подписью «человек едет на мотоцикле», на их примере нейросеть запоминает, как именно нужно сидеть за рулем. И по запросу «коала на мотоцикле» ИИ объединит все свои знания об этих объектах, чтобы создать собственную картинку.
В результате нейросеть выдаст множество изображений коал на разных мотоциклах, которых раньше не существовало.
Самые популярные нейросети
Эту нейросеть разработала компания OpenAI. Она выступает за доступность технологий искусственного интеллекта для всех людей, а не только для корпораций. Поэтому разработки OpenAI используют многие проекты с открытым исходным кодом.
Dall-e 2 раньше других нейросетей стала интернет-феноменом. В социальных сетях появлялись десятки сообществ, в которых пользователи выкладывали творчество нейросети по разным запросам.
«Средний план, фотография в redscale Давида Микеланджело в черных наушниках на темно-сером монохромном фоне»:
«Осьминог, читающий газету»:
«Высокодетализированный винтажный портрет капибары в маскарадном костюме, курящей сигару, винтажная фотография 1920-х годов»:
Такая популярность нейросети была связана с открытым бета-тестом, участие в котором принимали около миллиона пользователей. А в сентябре 2022 года компания открыла доступ для всех желающих, но для российских пользователей нейросеть пока недоступна.
Не все изображения Dall-e 2 генерируются бесплатно. Система рассчитывает оплату в кредитах: у новичков есть 50 кредитов — это примерно 200 изображений. Дополнительные попытки генерации можно купить за $15, это 115 кредитов или примерно 460 изображений.
Важно, что картинки, которые пользователь получил по своему запросу, он может использовать в коммерческих целях. Например, как иллюстрации на сайте или принты для футболок.
бесплатный проект
бесплатный проект
Дизайн-волна — ваше экспресс-погружение в дизайн-профессии. Участвуйте в эфире с экспертами, выполните несложные практические задания и получите подарки.
зарегистрироваться
Midjourney разработала одноименная американская компания. Качество изображений у этой нейросети не хуже, чем у Dall-e 2. И пока Dall-e была в закрытом бета-тесте с ограниченным доступом, Midjourney оказалась доступнее для большинства пользователей и обогнала конкурентов по количеству упоминаний.
Пользователи придумывали с нейросетью все более интересные проекты. Например, в Midjourney визуализировали финальный монолог репликанта из «Бегущего по лезвию»:
«Я видел такое, во что вы, люди, просто не поверите. Штурмовые корабли в огне на подступах к Ориону. Я смотрел, как Си-лучи мерцают во тьме близ врат Тангейзера. Все эти мгновения исчезнут во времени, как слезы под дождем. Пора умирать…»
В результате нейросеть сгенерировала вот такое изображение:
Пользоваться нейросетью можно через Discord. Если у вас нет учетной записи в этом сервисе, ее нужно будет создать и потом присоединиться к серверу Midjourney. Там вы увидите несколько чатов, которые называются newbies. Можно зайти в любой из них и отправлять запросы через строку ввода внизу:
Кроме вас в чате будут другие пользователи. Вы увидите, что генерируют они, а они будут видеть ваши запросы. В строке ввода сначала нужно будет ввести команду /imagine. В появившемся окне введите сам текст запроса. Лучше использовать английский, так как его Midjourney распознает качественнее других языков:
Stable Diffusion
Нейросеть от компании Stability.ai Stable Diffusion появилась недавно. Сервис Runway уже запустил на основе этой нейросети бесплатный видеоредактор, в котором можно править видео в реальном времени или создавать с нуля собственные видеоарты:
Но в первую очередь она создана для генерации изображений. Самые качественные результаты выдает версия Stable Diffusion, установленная на компьютер напрямую с GitHub. Для этого нужно скачать исходный код и запустить его по инструкции. Например, можно использовать интерфейс Stable Diffusion Gui:
В нем можно вручную менять настройки генерации и выбирать разные алгоритмы. В итоге могут получиться изображения довольно хорошего качества.
Когда искусственный интеллект заменит дизайнеров
В ближайшее время этого точно не случится. Несмотря на заметные достижения, нейросетям не хватает многих профессиональных черт. Дизайнеру требуются эмпатия и логическое мышление, чтобы создавать удобные и функциональные проекты: понятные сайты и интерфейсы, айдентику, которая передает ценности бренда, или комфортные интерьеры, в которых хочется находиться. А нейросеть пока не ориентируется на удобство для человека.
Читайте также:
мы спросили ChatGPT, сможет ли нейросеть заменить дизайнеров
Но искусственный интеллект может стать полезным инструментом. Например, он поможет преодолеть страх «белого листа», когда вы не знаете, с чего начать. Нейросеть сгенерирует по запросу несколько идей, от которых можно оттолкнуться, но не сделает за вас всю работу.
Дизайнеры интерфейсов могут создавать иконки приложений для прототипов. Например, по теме «еда» нейросети предлагают вот такие варианты:
Иконки Midjourney
Иконки Stable Diffusion
Дизайнерам интерьеров можно генерировать идеи для первых интерьерных скетчей:
Скетч интерьера Midjourney
Скетч интерьера Stable Diffusion
А графические дизайнеры могут привлекать нейросети в качестве иллюстраторов:
Иллюстрации Midjourney в акварельном стиле
Иллюстрации Stable Diffusion
Продюсер Кевин Гейгер в своем блоге на AWN говорит о том, что включение цифровых, а теперь и генеративных инструментов в рабочие процессы — это естественно. Тот факт, что любой может отправить фразу в генератор изображений, должен беспокоить художников не больше, чем возможность любого человека зайти в магазин художественных принадлежностей и купить кисти.
Всё о дизайне за 2 часа
Всё о дизайне за 2 часа
Бесплатный практикум + гайд "300 полезных ресурсов для дизайнера" после регистрации
Участвую