NVIDIA GauGAN2 превращает предложения в реалистичные фотографии

Программа на базе искусственного интеллекта GauGAN2 от NVIDIA может использовать простые письменные фразы для создания подходящего фотореалистичного изображения. Алгоритм глубокого обучения способен создавать различные сцены всего за три - четыре слова.

image_13

Сгенерированное ИИ изображение, созданное с помощью фразы “мирное озеро, окруженное высокими деревьями в туманный день”.

GauGAN-это программа на базе искусственного интеллекта, выпущенная в 2019 году, которая использовалась для превращения грубых набросков в фотореалистичные шедевры, технология, которая в конечном итоге была включена в приложение NVIDIA Canvas в начале этого года. На этот раз NVIDIA продвинула искусственный интеллект еще дальше, и теперь для создания “фотографии " программе требуется только краткое описание.

Как говорит NVIDIA, алгорит на основе так называемых генеративных состязательных сетей, лежащий в основе первой версии GauGAN, позволяет любому создавать красивые сцены, а сейчас это стало даже проще, чем когда-либо. Пользователи могут просто ввести фразу, например, “закат на пляже”, а искусственный интеллект сгенерирует соотвествующую сцену.  По мере добавления слов, например, “закат на скалистом пляже” или заменив “закат” на “день” или “дождливый день”, изображение в режиме реального времени будет меняться соотвествующим образом.  

«Одним нажатием кнопки пользователи могут сгенерировать карту сегментации - высокоуровневую схему, показывающую расположение объектов в сцене, - объясняет NVIDIA. - Оттуда они могут переключиться на рисование, настраивая сцену с помощью грубых обрывков, таких как небо, дерево, скала и река, позволяя умной кисти включать это всё в создаваемое изображение».

image_14

Сгенерированное искусственным интеллектом изображение, созданное с помощью фразы “тропический остров с видом на пляж с белым песком ”.

image_16

Сгенерированное искусственным интеллектом изображение, созданное с помощью фразы “бесконечные высокие горы в солнечный день”.

Кроме того, GauGan2 объединяет в себе отображение сегментации, рисование и генерацию текста в одной модели, что, по словам NVIDA, делает эту программу мощным инструментом, позволяющим создавать фотореалистичное искусство с помощью сочетания слов и рисунков. Цель состоит в том, чтобы быстрее и проще превратить видение художника в высококачественное изображение, сгенерированное ИИ. NVIDIA говорит, что по сравнению с другими современными моделями, предназначенными специально для приложений преобразования текста в изображение, GauGAN2 генерирует более разнообразный и более качественный набор изображений.

Таким образом, вместо того, чтобы рисовать каждый элемент воображаемой сцены, пользователи могут ввести краткую фразу, чтобы быстро сгенерировать ключевые объекты и тему изображения, например, заснеженный горный хребет. Затем эту отправную точку можно дополнить с помощью эскизов, чтобы сделать конкретную гору выше или добавить пару деревьев на переднем плане или облака в небе.

Хотя создание реалистичного изображения, вероятно, является наиболее впечатляющим, GauGAN2 не ограничивается только этим. Художники также могут использовать новую версию программы для изображения потусторонних и вымышленных пейзажей. NVIDIA демонстрирует сцену, которая воссоздает что-то похожее на несуществующую планету Татуин из "Звездных войн", где искусственный интеллект изначально создает сцену пустыни, но затем добавляет второе солнце.

«Это итеративный процесс, когда каждое слово, которое пользователь вводит в текстовое поле, добавляет больше деталей к изображению, создаваемому искусственным интеллектом».

Функцию преобразования текста в изображение можно протестировать на странице NVIDIA AI DEMOS >>, где любой желающий может попробовать создать свои сцены с текстовыми подсказками и дополнительно настроить их с помощью быстрых эскизов для получения более точных результатов.

Источник: PetaPixel

5 кадров с Harman Phoenix 200 и Olympus Pen D

5 кадров с Harman Phoenix 200 и Olympus Pen D

Блог6 ч. назад
Harman Phoenix 200 - новейшая цветная пленка от Ilford. Наконец-то у Kodak появился реальный конкуре...
Как превратить плёночную камеру в цифровую

Как превратить плёночную камеру в цифровую

Блог3 года назад
Видеоблогер [befinitiv] опубликовал на своём YouTube-канале видео, в котором показал, как ему удалос...
Фотоархив: история культовой фотографии Ормонда Джильи «Девушки в окнах», 1960 год

Фотоархив: история культовой фотографии Ормонда Джильи «Девушки в окнах», 1960 г...

Блог2 года назад
В 1960 году фотожурналист Ормонд Джильи собрал 43-х женщин, одел их в изысканные красочные наряды и ...
Булат Окуджава

Булат Окуджава

Блог8 лет назад
А ведь Булат Шалвович просил... Нет, не просил, конечно. Он пел в форме нежного повеления о то...
Три эпохи фотографии: пластина, плёнка, «цифра»

Три эпохи фотографии: пластина, плёнка, «цифра»

Блог2 года назад
После изобретения в начале 1800-х годов фотография и фотокамеры прошли долгий путь развития. Громозд...
За крокусами в Карпаты! Часть 1

За крокусами в Карпаты! Часть 1

Блог5 лет назад
Весной всегда хочется чуда. Яркого и красивого чуда. А ждать, пока оно придёт само - не хочется (вед...
Эвелин Бенчикова: стирая границы между реальностью, памятью и воображением

Эвелин Бенчикова: стирая границы между реальностью, памятью и воображением

Блог4 мес. назад
Эвелин Бенчикова, родившаяся в Братиславе, Словакия, занимается визуальным творчеством, специализиру...
Адам Кайл Джексон: в погоне за бурей

Адам Кайл Джексон: в погоне за бурей

Блог3 мес. назад
Адам Кайл Джексон известен своим невероятным талантом фотографа-охотника за штормами. Родом из Техас...
Концептуальная фотография Амели Сацгер

Концептуальная фотография Амели Сацгер

Блог4 мес. назад
Амели Сацгер - фотохудожница из Мюнхена. Ее фотографии раскрывают искусно организованный визуальный ...
Джоэп Хиджвеген: предвидеть случайность

Джоэп Хиджвеген: предвидеть случайность

Блог5 мес. назад
Джоэп Хиджвеген - уличный фотограф из Амстердама, чей художественный стиль определяется отражениями ...
Тристан Холлингсворт: жажда странствий и ностальгия

Тристан Холлингсворт: жажда странствий и ностальгия

Блог1 год назад
Фотограф, Тристан Холлингсворт, создает эфирные и глубоко поглощающие аналоговые образы, которые выз...
Рэйчел Уайт: цветочный фьюжен

Рэйчел Уайт: цветочный фьюжен

Блог5 мес. назад
Эксперименты Рэйчел Уайт с плёнкой LomoChrome на цветочную тематику с использованием двойной экспоз...
Три истории о Кологривском Крае. История Третья. Сплав по реке Унжа.

Три истории о Кологривском Крае. История Третья. Сплав по реке Унжа.

Блог8 лет назад
Вот и подходит к концу мой небольшой цикл заметок о Кологривском крае. Но без рассказа о реке Унжа н...
Фотограф и модель побили мировой рекорд Гиннесса по глубине подводной фотосессии

Фотограф и модель побили мировой рекорд Гиннесса по глубине подводной фотосессии

Блог1 год назад
То, что началось как шутка о том, как безопасно проводить фотосессию во время ограничений COVID-19, ...
Марек Вюрфль: воспоминания из детства

Марек Вюрфль: воспоминания из детства

Блог5 мес. назад
Марек Вюрфль - фотограф-портретист-самоучка с опытом работы в живописи. Живущий в Братиславе, Словак...
NVIDIA GauGAN2 превращает предложения в реалистичные фотографии
журнал ФотоТехника

Комментарии

Отправить