«Тупые телефоны», война со слопом и геймификация сериалов: NYT предсказал тренды 2026 года
Температура мирового океана достигла нового рекорда в 2025 году
На Хлебозаводе покажут спектакль «Маленький принц»
Съемки четвертого сезона «Белого лотоса» пройдут в замке XIX века в Сен-Тропе
Золотое кольцо увеличат на 49 населенных пунктов
Принцесса Уэльская Кейт сказала, что природа помогла ей исцелиться
Пес-«Гудини» устроил побег из приюта ― он вскрыл замок пастью
Индонезия заблокировала ИИ-чат Grok из‑за риска создания порнографии
PUBG Mobile представила коллаборацию с сериалом «Острые козырьки»
Хит Джо Кири «End of Beginnings» набрал 2 млрд прослушиваний и возглавил чарты
Моррисси объявил о первом за шесть лет альбоме «Make-Up Is a Lie»
Мексиканский университет запустил дипломный курс по психоанализу «Евангелиона»
Собаки могут учить новые слова, подслушивая разговоры людей
Долина не передаст квартиру Лурье до 20 января
В России закрылись 25 одежных брендов за год
«Черное зеркало» продлили на 8-й сезон
Актеры сериала «Солдаты» застряли в пробке на Ярославском шоссе и опоздали на собственный спектакль
Театр им. Маяковского проведет благотворительную ярмарку, на которой можно приобрести вещи артистов
Ученые: 22 января вокруг Солнца соберется уникальный парад планет
Вышел трейлер финальной части хоррора «Незнакомцы» об убийцах в масках. Премьера — 6 февраля
Паша Техник обошел Путина и Трампа по популярности в русской Википедии
В Вологодской области закрылись все 610 алкомаркетов
На Bad Bunny подала в суд девушка. Она утверждает, что ее голос использовали в песнях без разрешения
Алан Камминг признался, что из‑за него Педро Паскаль повредил шею во время съемок новых «Мстителей»
В Калифорнии медведя смогли «выселить» из жилого дома только спустя 37 дней
Бруно Марс отправится в тур впервые после 10-летнего перерыва в сольной карьере
Сериал «Больница Питт» продлили на третий сезон
Дом детства Дэвида Боуи отреставрируют и откроют для публики

Нейросеть научили превращать текст в картинки. Она изобразила редиску с собачкой и кресло-авокадо!

Изображение на превью: OpenAI

Американская команда разработчиков OpenAI создала нейросеть, способную превращать текст в картинки. В ее основе — алгоритм последнего поколения для обработки языка GPT-3, который уже обучали генерировать идеи для бизнеса, тексты песен, статьи и даже отвечать на философские вопросы.

Новая разработка получила название DALL·E. Принцип ее работы следующий: человек описывает некий предмет или ситуацию, к примеру, «редиска выгуливает собаку» или «кресло в форме авокадо», а алгоритм изображает это на картинке.

При одном и том же запросе результат каждый раз получается разным. Некоторые из сгенерированных картинок будут неотличимы от созданных человеком, другие — едва связными и понятными. Однако серьезных ошибок и абсолютной бессмыслицы алгоритм не допускает.

На сайте OpenAI показаны десятки примеров работы алгоритма, в которых можно самостоятельно поменять параметры. Например, «профессиональную высококачественную иллюстрацию химеры жирафа и черепахи» можно превратить в не менее качественно нарисованную смесь кота и слона или льва и цыпленка, создавая сотни различных версий мутантов (иногда милых, иногда пугающих).

Все примеры на сайте — это 30 лучших, по мнению разработчиков, изображений из 512, сгенерированных нейросетью по указанному запросу. Никакой ретуши к картинкам не применялось.

DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение и так далее) и может создавать антропоморфных животных, фотографически точные изображения, а также комбинировать несвязанные понятия.

К примеру, нейросеть способна понять фразу «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны». Однако разработчики подчеркивают, что результат сильно зависит от формулировки запроса. Часто идентичные по смыслу предложения интерпретируются алгоритмом по-разному и приводят к неверной визуализации.

Текстовый запрос: «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны».

Программа также может изобразить объект с разных ракурсов — она видит различие между «капибарой крупным планом» и «капибарой, сидящей в поле». Более того, изображения гипсового бюста под разными углами, сгенерированные DALL·E, позволили создать плавную 3D-анимацию вращающейся головы.

Исследователи считают, что работа с генеративными моделями, такими как DALL·E, может оказать серьезное влияние на общество. В будущем они планируют проанализировать связь подобных моделей с социальными проблемами, к примеру с воздействием экономики на рабочие процессы и профессии, а также изучат долгосрочные этические последствия, к которым может привести технология.

Расскажите друзьям