В чате с Алисой AI теперь можно создавать изображения с более длинными и корректными надписями на русском языке.
Яндекс обновил модель Alice AI ART: теперь она лучше справляется с постерами, афишами, открытками и другими картинками, где важен читаемый текст.
Что изменилось
Обычно нейросети часто ломаются на русских надписях: путают буквы, добавляют бессмысленные символы или превращают текст в кашу. В Яндексе объясняют это тем, что в открытых датасетах русский язык представлен хуже, чем английский.
Чтобы исправить проблему, команда обучила Alice AI ART на собственном масштабном датасете изображений с русскоязычными надписями и детальной разметкой текста. Также была изменена архитектура модели.
После обновления Алиса AI стала в 3 раза чаще генерировать изображения с корректным русским текстом — без ошибок и нечитаемых букв.
Как добиться лучшего результата
Яндекс советует:
- Заключать нужный текст в кавычки
- Писать сложные слова заглавными буквами
- Разбивать длинные надписи на короткие фразы
Картинки тоже стали качественнее
По данным Яндекса, общее качество генерации выросло на треть. Речь о доле изображений без визуальных искажений.
Кроме того, модель стала лучше понимать русский культурный контекст.
Например, по запросу «русский народный ансамбль» она может показать гармонистов и балалаечников, а по запросу «традиционный русский праздничный стол» — икру, соленья и самовар. В космических сценах модель может добавить российских космонавтов.
Для бизнеса тоже есть польза
Обновлённая модель стала доступна на платформе Yandex AI Studio. Там появился инструмент Image Generation Tool для бизнес-сценариев.
Например, ИИ-агент сможет автоматически создавать изображения для карточек товаров на маркетплейсах, когда данные о товарах появляются в корпоративной базе.


1 комментарий