ChatGPT и Gemini отлично справляются с редактированием фотографий. Искусственный интеллект особенно выручает в ситуациях, когда работа в Photoshop занимает слишком много времени.
Например, когда нужно переодеть человека, изменить цвет одежды или добавить новый объект на фото.
Я собрал несколько фото знаменитостей, чтобы наглядно показать, как это работает, и сравнил ChatGPT и Gemini в одинаковых условиях.
Для чистоты эксперимента использовал максимально простые промты. Именно такие чаще всего задают обычные пользователи.
1. Ким Кардашьян
📍 Промт
Переодень её в советскую учительницу.


Самый простой промт, который на самом деле позволяет хорошо проверить, как думают нейросети. В частности, как они представляют образ советской учительницы.
На мой взгляд, Gemini явно лучше справился с заданием, хотя его образ больше похож на выпускницу.
Кроме того, Gemini полностью сохранил лицо Ким Кардашьян, в то время как ChatGPT её полностью перерисовал, так что теперь её не узнать.
2. Скарлетт Йоханссон
📍 Промт
Переодень ее в библиотекаря.


Если оценивать только образы, то мне сложно выделить победителя. ChatGPT сделал классический образ, вероятно, который многие представляют. Gemini, наоборот, решил сделать современный лук.
Но в любом случае победа за Gemini, потому что он смог сохранить все черты лица.
3. Анджелина Джоли
📍 Промт
Замени наряд на красивое вечернее платье.


Вот здесь победителя я выбрать не могу. Обе нейросети хорошо справились с заданием. Причём, заметьте, промт такой же простой, как в первых двух примерах, но результаты сильно отличаются.
В случае с Анджелиной Джоли нужно просто выбрать, какое платье вам больше нравится.
Как менять одежду в нейросетях

Буду показывать на примере ChatGPT и Gemini. На самом деле, ничего сложного нет.
1. Загружаете свою фотографию
2. Пишете запрос, в котором указываете, что именно вы хотите изменить на снимке и что нужно обязательно сохранить
При желании можете прикрепить дополнительные фото. Например, изображение конкретной вещи, которую вы хотите примерить на себя.
4. Снуп Догг
📍 Промт
Переодень мужчину на фото в костюм Джедая из Звездных Войн.
Убери золотые украшения, но оставь очки.
Микрофон убери. Вместо микрофона он должен держать световой меч.


Я попробовал усложнить промт и дополнить его деталями. В этом случае и ChatGPT, и Gemini показали хороший результат.
Gemini опять лучше сохранил лицо, а его образ джедая выглядит естественнее.
5. Дуэйн Джонсон
📍 Промт
Переодень мужчину на фото в костюм Шелдона из Теории большого взрыва
Убери очки
Руки не должны быть в карманах


Ох, похоже, это самый показательный случай в разнице между ChatGPT и Gemini.
ChatGPT превратил «Скалу» в игрушечную фигурку, по-другому не скажешь.
Gemini тут на голову выше, поэтому, со знаменитостями можно заканчивать.
Попросил ChatGPT и Gemini отредактировать свои фото.
6. Замена кроссовка
📍 Промт
Сделай кроссовки на первом фото, чтобы дизайн был как на втором.


Gemini справился с заданием за несколько секунд. Снимок остался почти без изменений, но и дизайн кроссовка тоже почти не изменился. По сути, Gemini поменял только подошву, а в остальном кроссовок не похож на тот, что я отправлял.
ChatGPT заметно изменил фотографию. Работа ИИ видна невооружённым глазом, хотя сам кроссовок больше похож на исходный вариант.
Но если выбирать между этими двумя изображениями, я бы отдал предпочтение Gemini, потому что его результат почти не отличается от настоящего снимка.
7. Замена футболки
📍 Промт
Замени футболку и рубашку на черную футболку оверсайз.


Мне понравился результат Gemini. Увидев это фото в интернете, я бы вряд ли понял, что передо мной работа ИИ.
ChatGPT хорошо прорисовал футболку, но сделал меня толще, чем на исходном снимке. Особенно заметно это на руках.
8. Замена дубленки на куртку
📍 Промт
Убери дубленку и добавь вместо неё куртку, которая на втором фото.


В этом тесте наглядно видно различие между Gemini и ChatGPT.
Gemini максимально сохранил исходное фото, включая лицо и положение рук. Кроме того, он аккуратно прорисовал куртку и футболку.
ChatGPT, как обычно, полностью перерисовал снимок, из-за чего он выглядит неудачно. Лицо тоже не сохранилось. Куртка прорисована хуже, чем у Gemini. В целом работу ИИ сложно не заметить, такой снимок использовать невозможно.
9. Замена поло на худи
📍 Промт
Замени поло на худи цвета хаки.


Этот тест ChatGPT тоже провалил. Он снова изменил лицо, поэтому снимок никуда не годится. Gemini, наоборот, сохранил лицо.
Что касается замены одежды, обе нейросети справились с задачей, но результат Gemini выглядит реалистичнее.
10. Замена всей одежды и обуви
📍 Промт
Замени шорты и футболку на брюки и белую рубашку с подвернутыми рукавами. Рубашка должна быть заправлена в брюки. Вместо кед должны быть черные лоферы.


Самое сложное испытание для обеих нейросетей.
Gemini в целом сделал качественное изображение, хотя не выполнил все требования. Рубашка получилась с коротким рукавом вместо подвернутого, и почему-то она не заправлена в брюки.
ChatGPT провалил задание, так как не смог сохранить лицо. Тело тоже оказалось перерисовано странным образом. С заменой одежды он справился не идеально: рубашка заправлена в брюки, но почему-то с длинным рукавом.
Выбираем победителя
Оба чат-бота умеют менять одежду на фотографиях, но с нюансами:
▶︎ ChatGPT перерисовывает изображения и не всегда сохраняет черты лица и тела. Можно попробовать указать в промте, чтобы он этого не делал, но стопроцентной гарантии нет.
▶︎ Поскольку ChatGPT сохраняет мало оригинальных деталей, итоговый результат не всегда удачный. Многое зависит от исходного снимка и удачи. Иногда приходится просить ChatGPT переделать фото, чтобы получить приемлемый вариант.
▶︎ Gemini лучше сохраняет детали на изображении, включая лицо и тело, поэтому его результаты выглядят реалистичнее.
▶︎ Кроме того, Gemini работает заметно быстрее. В моих тестах он оказался в 3–4 раза быстрее ChatGPT, и эта разница хорошо ощущается.
▶︎ Качество готовых фото у Gemini ниже, чем у ChatGPT. Об этой проблеме пишут и на Reddit. Некоторые пользователи считают, что таким образом Google экономит энергию.
▶︎ На всех снимках Gemini есть водяной знак в правом нижнем углу, в ChatGPT его нет.
Но если выбирать победителя, то я отдаю предпочтение Gemini, потому что в первую очередь ИИ должен сохранять как можно больше оригинальных деталей при редактировании снимков.


Gemini с нано банана сейчас лучшая нейронка для генерации изображений, чат прям сильно уступает, хотя и Gemini пока что не идеально справляется с текстом
Да, гемини заметно качественнее делает