Спилберг год работал над «Интерстелларом», но уступил фильм Кристоферу Нолану по совету его брата
В российских приютах живут до 250 тыс. бездомных животных
Стэнфордский университет признали нежелательной организацией в России
Главным редактором школьных учебников по обществознанию стал Дмитрий Медведев
10-летняя девочка написала письмо в НАСА с просьбой вновь сделать планетой Плутон. Ей ответили
Вышел тизер зомби-хоррора «Колония» — новой работы от режиссера «Поезда в Пусан»
В Okko стартует фантастический сериал «Радар» ― о загадочных событиях в небольшом советском городе
Коту Барсику, которого бросили в московском аэропорту, нашли новый дом
Акция «Бессмертный полк» в этом году пройдет в смешанном формате
Московская карта «Тройка» заработала в Саратове
Ученые: к 2080 году популяция императорских пингвинов сократится вдвое
Леди Гага станцевала под «Runway» из «Дьявол носит Prada-2» на туре «Mayhem»
Оксимирон* выпустил новый клип «Exit»
В инстаграме* теперь можно редактировать комментарии, но только в первые 15 минут
Названы самые популярные пароли у россиян
Опрос: число новых регистраций в приложениях для знакомств в РФ весной растет на 20–23%
Умер пионер хип-хопа Африка Бамбаатаа. Ему было 68 лет
23 апреля выйдет новый роман Виктора Пелевина — «Возвращение Синей Бороды»
Федор Конюхов планирует побить свой рекорд высоты полета на воздушном шаре
Ханс Циммер станет единственным композитором 3-го сезона «Эйфории»
Лампады с Благодатным огнем доставят в 15 храмов Москвы
Оливия Родриго поделилась отрывком нового сингла «Drop Dead»
Матвеев, Прилучный и Машков: названы самые брутальные актеры России
У Telegram вновь произошел массовый сбой в России
Леди Гага и Doechii выпустили сингл «Runway» — саундтрек «Дьявол носит Prada-2»
Ив Хьюсон и Ченнинг Татум сыграют в фильме «Остров Мэн»
Наташу Лионн вывели из самолета после премьеры третьего сезона «Эйфории»
Кэмерон Диас снимется в сиквеле «Амазонок из Беверли-Хиллз». Его поставит Клеа ДюВалл

Нейросеть научили превращать текст в картинки. Она изобразила редиску с собачкой и кресло-авокадо!

Изображение на превью: OpenAI

Американская команда разработчиков OpenAI создала нейросеть, способную превращать текст в картинки. В ее основе — алгоритм последнего поколения для обработки языка GPT-3, который уже обучали генерировать идеи для бизнеса, тексты песен, статьи и даже отвечать на философские вопросы.

Новая разработка получила название DALL·E. Принцип ее работы следующий: человек описывает некий предмет или ситуацию, к примеру, «редиска выгуливает собаку» или «кресло в форме авокадо», а алгоритм изображает это на картинке.

При одном и том же запросе результат каждый раз получается разным. Некоторые из сгенерированных картинок будут неотличимы от созданных человеком, другие — едва связными и понятными. Однако серьезных ошибок и абсолютной бессмыслицы алгоритм не допускает.

На сайте OpenAI показаны десятки примеров работы алгоритма, в которых можно самостоятельно поменять параметры. Например, «профессиональную высококачественную иллюстрацию химеры жирафа и черепахи» можно превратить в не менее качественно нарисованную смесь кота и слона или льва и цыпленка, создавая сотни различных версий мутантов (иногда милых, иногда пугающих).

Все примеры на сайте — это 30 лучших, по мнению разработчиков, изображений из 512, сгенерированных нейросетью по указанному запросу. Никакой ретуши к картинкам не применялось.

DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение и так далее) и может создавать антропоморфных животных, фотографически точные изображения, а также комбинировать несвязанные понятия.

К примеру, нейросеть способна понять фразу «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны». Однако разработчики подчеркивают, что результат сильно зависит от формулировки запроса. Часто идентичные по смыслу предложения интерпретируются алгоритмом по-разному и приводят к неверной визуализации.

Текстовый запрос: «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны».

Программа также может изобразить объект с разных ракурсов — она видит различие между «капибарой крупным планом» и «капибарой, сидящей в поле». Более того, изображения гипсового бюста под разными углами, сгенерированные DALL·E, позволили создать плавную 3D-анимацию вращающейся головы.

Исследователи считают, что работа с генеративными моделями, такими как DALL·E, может оказать серьезное влияние на общество. В будущем они планируют проанализировать связь подобных моделей с социальными проблемами, к примеру с воздействием экономики на рабочие процессы и профессии, а также изучат долгосрочные этические последствия, к которым может привести технология.

Расскажите друзьям