Две утраченные композиции Баха исполнили впервые за 320 лет
Вышел трейлер второго сезона «Провожающей в последний путь Фрирен»
С 1 марта алкоголь в общепите во дворах Подмосковья можно будет купить только в течение двух часов
Американскую «Игру в кальмара» начнут снимать в 2026 году
38% зумеров считают себя поколением, которое привносит новые ценности на рынок труда
Сеть магазинов одежды Modis собирается стать банкротом
Режиссер «Истории игрушек-5» Эндрю Стэнтон считает, что у франшизы нет предела для продолжений
Суд отклонил иск о сексуализированном насилии к Вину Дизелю из‑за юридического вопроса
«Яндекс» проводит эксперимент по развитию сознания у ИИ
Роман Стивена Кинга «Оно» исчез с крупных российских маркетплейсов и из книжных магазинов
Джонатан Бейли написал письмо самому себе в прошлом
French Montana выступит в Москве в 2026 году
«Друзья» выложили последние 8 серий спин-оффа «Джоуи». Сериал закрыли 19 лет назад
Ветеринар рассказала о полной реабилитации кошки Муси, спасенной у «Ласточкина гнезда»
Кевин Спейси стал бездомным после скандала с харассментом: «Я живу в отелях и Airbnb»
Amazon выпустит новый сериал по «Звездным вратам»
Шоураннер «Бойся ходячих мертвецов» подал в суд на AMC из‑за невыплаченной прибыли
«Кристи» с Сидни Суини установил антирекорд по сборам во второй уикенд — падение составило 91,7%
Трамп подписал закон о рассекречивании документов Джеффри Эпштейна
Дейзи Ридли спасается от зомби в трейлере фильма «Мы хороним мертвых»
Сидни Суини собирает сплетни для Аманды Сейфрид в отрывке «Горничной»
Letterboxd запустит Video Store — аренду фильмов внутри платформы
«Ночи в стиле буги» Пола Томаса Андерсона выйдут в 4K
Реставрацию петербургского кинотеатра «Аврора» начнут следующей осенью
Компания FoloToy сняла с продаж плюшевого медведя с ИИ, который обсуждал с детьми секс и наркотики
В «Симпсонах» убили одного из старейших второстепенных персонажей
Вышел новый трейлер «Хронологии воды» — режиссерского дебюта Кристен Стюарт
В США мужчина прославился в соцсетях после того, как кто‑то просматривал его резюме на концерте

Нейросеть научили превращать текст в картинки. Она изобразила редиску с собачкой и кресло-авокадо!

Изображение на превью: OpenAI

Американская команда разработчиков OpenAI создала нейросеть, способную превращать текст в картинки. В ее основе — алгоритм последнего поколения для обработки языка GPT-3, который уже обучали генерировать идеи для бизнеса, тексты песен, статьи и даже отвечать на философские вопросы.

Новая разработка получила название DALL·E. Принцип ее работы следующий: человек описывает некий предмет или ситуацию, к примеру, «редиска выгуливает собаку» или «кресло в форме авокадо», а алгоритм изображает это на картинке.

При одном и том же запросе результат каждый раз получается разным. Некоторые из сгенерированных картинок будут неотличимы от созданных человеком, другие — едва связными и понятными. Однако серьезных ошибок и абсолютной бессмыслицы алгоритм не допускает.

На сайте OpenAI показаны десятки примеров работы алгоритма, в которых можно самостоятельно поменять параметры. Например, «профессиональную высококачественную иллюстрацию химеры жирафа и черепахи» можно превратить в не менее качественно нарисованную смесь кота и слона или льва и цыпленка, создавая сотни различных версий мутантов (иногда милых, иногда пугающих).

Все примеры на сайте — это 30 лучших, по мнению разработчиков, изображений из 512, сгенерированных нейросетью по указанному запросу. Никакой ретуши к картинкам не применялось.

DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение и так далее) и может создавать антропоморфных животных, фотографически точные изображения, а также комбинировать несвязанные понятия.

К примеру, нейросеть способна понять фразу «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны». Однако разработчики подчеркивают, что результат сильно зависит от формулировки запроса. Часто идентичные по смыслу предложения интерпретируются алгоритмом по-разному и приводят к неверной визуализации.

Текстовый запрос: «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны».

Программа также может изобразить объект с разных ракурсов — она видит различие между «капибарой крупным планом» и «капибарой, сидящей в поле». Более того, изображения гипсового бюста под разными углами, сгенерированные DALL·E, позволили создать плавную 3D-анимацию вращающейся головы.

Исследователи считают, что работа с генеративными моделями, такими как DALL·E, может оказать серьезное влияние на общество. В будущем они планируют проанализировать связь подобных моделей с социальными проблемами, к примеру с воздействием экономики на рабочие процессы и профессии, а также изучат долгосрочные этические последствия, к которым может привести технология.

Расскажите друзьям