Юрия Сапрыкина назначили директором по развитию Музея ОБЭРИУ
Источники сообщают, что Пол Беттани может стать новым Волан-де-Мортом
Средняя продолжительность рабочего дня в России составила 7,16 часа
Появился трейлер концертного фильма BTS на Netflix
Путин поручил рассмотреть вопрос ограничения движения электровелосипедов по тротуарам
В Приморье выпустили четырех детенышей дальневосточного лесного кота
Билли Зейн присоединится к сериалу «Король гольфа»
Ринго Старр выпустит новый кантри-альбом
Сериал «Начальная школа „Эбботт“» продлили на шестой сезон
Люси Бойнтон снимется во втором сезоне «Рыцаря Семи Королевств»
Тейяна Тейлор умоляет Пола Томаса Андерсона снять сиквел о ее героине из «Битвы за битвой»
Кристиан Бейл — о ремейке «Американского психопата»: «Смелый шаг. Удачи им»
На «Госуслугах» появится сервис для сдачи пробного ЕГЭ
Селена Гомес рассказала, что Тейлор Свифт написала песню о ней
Кейли Куоко снимется с Реем Романо и Джошуа Джексоном в сериале «Как выжить без меня»
Билл Клинтон улыбнулся, рассматривая свои фото из файлов Эпштейна
В московском музее «Царицыно» открыли выставку весенних цветов
Станцию метро «Трубная» к 8 Марта украсили с помощью более чем 400 алых роз
Создатели «Прыгунов» вдохновлялись «Безумным Максом»
Деми Ловато и Кеке Палмер пожалели, что подростками встречались со взрослыми мужчинами
Apple представила бюджетный MacBook Neo
4-й сезон «Бриджертонов» собрал 28 млн просмотров на Netflix
Doechii призналась, что не любит кошек. Пользователи соцсетей теперь не любят Doechii
В «Царь-макете» 19 марта откроется экспозиция об азиатской части России
Россияне стали больше тратить на сладости
Появился эксклюзивный фрагмент «Охоты за тенью» с Джеки Чаном в главной роли
В Москве запустят четвертый маршрут речного электротранспорта Лужники — Киевский
Великобритания вводит запрет на визы для четырех стран

Alibaba представила бесплатный генератор картинок Qwen-Image

Изображение: Alibaba

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.

Главное отличие Qwen-Image от многих конкурентов ― точная отрисовка текста. Новинка поддерживает как алфавитные, так и иероглифические системы письма, позволяя сочетать латиницу и иероглифы на одном изображении.

В компании отмечают, что их продукт отлично работает со сложной типографикой и многострочной версткой. Кроме того, он показывает «высокую стабильность при редактировании изображений, сохраняя смысловую целостность». По запросу можно стилизовать картинку, отредактировать текст, поменять фон или позы изображенных персонажей, удалить или заменить объекты. Это позволяет создавать контент вроде постеров, слайдов, витрин магазинов, каллиграфии и инфографики.

Журналист Venture Beat, опробовавший генерацию картинок в Qwen-Image, отметил, что точность следования запросу и качество текста оказались не выше, чем у Midjourney. Иногда модель неверно понимала запросы и передавала текст ― не спасали даже переформулировки.

Qwen-Image основана на архитектуре MMDiT с 20 млрд параметров — такой же, как у Flux.1 и будущей Stable Diffusion 3. Согласно техническому отчету, модель прошла многоэтапное обучение на миллиардах пар «изображение + текст».

В публичных тестах Qwen-Image показала равные или лучшие результаты, чем GPT Image 1, Seedream 3.0 и Flux.1 Kontext Pro. На платформе AI Arena модель занимает 3-е место среди всех и 1-е место среди open-source-решений.

Расскажите друзьям
Теги: