Google представила нейросеть Gemini 2.0 Flash, которая может «на лету» редактировать изображения по текстовым запросам

Google представила улучшенную версию нейросети Gemini 2.0 Flash, которая позволяет пользователям редактировать изображения в режиме реального времени.

Пользователи могут не просто вводить запрос и получать изображение, но и редактировать его в ходе обычного диалога, как с человеком. Контекст сохраняется на протяжении всей беседы, что делает процесс более интуитивным.

Кроме того, обновленная версия модели лучше справляется с генерацией изображений с текстом, в том числе с длинными последовательностями символов.

Любой разработчик или пользователь может опробовать Gemini 2.0 Flash в Google AI Studio или через Gemini API. Для этого в меню выбора модели (на ПК) нужно перейти в раздел “preview” и установить формат вывода “Images + text”. Однако есть лимиты.

You can now test Gemini 2.0 Flash’s native image output

Following Gemma 3 and Gemini Robotics earlier today, Google’s AI news continues with wider access to native image output in Gemini 2.0 Flash that allows for conversational image editing alongside other capabilities.

9to5Google

Google Нейросети фото Новости

iPhones.ru

Google представила улучшенную версию нейросети Gemini 2.0 Flash, которая позволяет пользователям редактировать изображения в режиме реального времени. Пользователи могут не просто вводить запрос и получать изображение, но и редактировать его в ходе обычного диалога, как с человеком. Контекст сохраняется на протяжении всей беседы, что делает процесс более интуитивным. Кроме того, обновленная версия модели лучше справляется...