Google представила улучшенную версию нейросети Gemini 2.0 Flash, которая позволяет пользователям редактировать изображения в режиме реального времени.
Пользователи могут не просто вводить запрос и получать изображение, но и редактировать его в ходе обычного диалога, как с человеком. Контекст сохраняется на протяжении всей беседы, что делает процесс более интуитивным.
Кроме того, обновленная версия модели лучше справляется с генерацией изображений с текстом, в том числе с длинными последовательностями символов.
Любой разработчик или пользователь может опробовать Gemini 2.0 Flash в Google AI Studio или через Gemini API. Для этого в меню выбора модели (на ПК) нужно перейти в раздел “preview” и установить формат вывода “Images + text”. Однако есть лимиты.

4 комментария
Форум →