Нейросети уже вовсю умеют работать не только с текстом, но и с фотографиями. Снимок можно отдать ИИ и просто словами описать, что хочется изменить.
Убрать фон, заменить его на море или закат, переодеть человека, добавить детали, сделать кадр кинематографичным — всё это выполняется без привычных редакторов и долгих кликов мышкой. По сути, достаточно одной подсказки, чтобы обычное фото превратилось в картинку «как из кино».
Мы решили проверить, как справляется новейшая ChatGPT 5 с этой задачей. Будет несколько сценариев и фотографий.
На ком и что проверяем
Всего пять позиций:
• один человек
• семья
• собака
• ребенок
• девушка
Для каждой будем использовать различные промпты: от стилизации под фильмы и удаления фона до замены фона и изменения стиля изображения.
Стилизация под фильм

Оригинал
📍 Промпт: Преобразуй фото человека в кинематографическом стиле. Используй цветокоррекцию и атмосферу фильма «Матрица» — зелёный фильтр, тёмная урбанистическая эстетика, драматичный свет. Сделать так, будто кадр взят из культового блокбастера, с кинопостановкой, резким контрастом и зернистой плёнкой.

В целом оба результата неплохо получились
Оба генератора выдали в целом подходящие результаты. Однако лично мне не хватило именно эффекта «Матрицы».
Удаление фона

Оригинал
📍 Промпт: Аккуратно вырезать человека, удалить весь фон. Оставить только человека на прозрачном фоне (PNG). Максимально чистые края, без артефактов.

ChatGPT, отличный результат

Grok исказил фото, не справился с задачей
ChatGPT смог точно обрезать человека на фото и никак его не исказил. Плюс выдал мне готовый PNG с прозрачным фоном. Grok же изменил лицо, сделал якобы прозрачный фон, не смог нормально обрезать только человека и изуродовал землю.
Замена фона

Оригинал
📍 Промпт: Заменить фон фото человека на яркое летнее небо с лёгкими облаками и солнечными лучами. Атмосфера тепла, свежести и свободы. Сделать так, чтобы освещение на фотографии человека совпадало с новым фоном.

ChatGPT целиком понял задачу и сделал совсем другой фон, тогда как Grok лишь изменил некоторые детали, например подтянул небо и сделал снимок теплее.
Полет фантазии детища от OpenAI слишком обширный, но и запрос был не настолько точен, так что результат оправдан.
Перенос семьи на пляж

📍 Промпт: Поместить фото семьи на фон морского пляжа. Солнечный летний день, голубая вода, золотой песок, лёгкие волны. Добавить атмосферу отдыха: пляжные аксессуары (зонтики, шезлонги). Освещение подогнать под естественный солнечный свет.

ChatGPT
Здесь обе модели справились хорошо. Однако у меня есть лишь небольшая претензия по поводу самого берега у Grok. Да и лица он снова исказил, хоть и совсем немного.

Grok
Замена одежды

Оригинал
📍 Промпт: Заменить одежду на парне на новый стиль: вечерний костюм, стиль красной дорожки. Сохранить естественность позы и пропорции тела. Сделать так, чтобы ткань выглядела реалистично, с фактурой, тенями и правильным падением света.

Не хотел бы я присутствовать на какой-нибудь церемонии с красной дорожкой в костюме от Grok. Верх в обоих случаях получился хорошим, но низ ИИ Илона Маска решил оставить всё равно спортивным по непонятным причинам.
Превращение собаки в более мимимишную

📍 Промпт: Преобразовать собаку в максимально милый образ. Увеличить глаза, добавить лёгкую улыбку, сделать морду доброй и мультяшной. Стилизация под Pixar/Disney: пушистая шерсть, мягкий свет, выразительные глаза. Эффект — мимимишный щенок, от которого тает сердце.

Главной задумкой тут было преображение моей собаки в персонажа Pixar/Disney, и тут ChatGPT справился на ура. Grok решил пойти в аниме-творчество. Зачем? Почему? Только Маск знает.
Создание волшебной атмосферы

📍 Промпт: Превратить фото ребёнка в волшебную иллюстрацию. Ребёнок изображён как главный герой фэнтези-истории: маленький исследователь с сияющими глазами. На нём лёгкий плащ с капюшоном, в руках волшебный фонарь, из которого вырываются мягкие золотые огоньки. Вокруг него сказочный лес с гигантскими светящимися грибами, летающими феями и тёплым лунным светом. Атмосфера — смесь «Алисы в стране чудес» и «Властелина колец», детская магия и приключение. Картинка должна быть кинематографичной, с мягким туманом и красивыми бликами света.

В этом случае обе модели поняли основную задумку.
Однако помесь «Алисы» и «Властелина колец» смог передать только ChatGPT. Да и на изображении от «чата» всё сочетается сильнее, у Grok ребенок выглядит каким-то не естественным, лишним в кадре.
ИИ уже вполне может помогать вместо фотошопа
Базовые элементы сделать могут обе нейросети. Однако Grok сильно уступает в точности понимания запроса и генерации готового изображения ChatGPT.
Тем не менее, наш небольшой эксперимент показал, что какие-то задачи по редактированию фотографий вполне можно попробовать отдать в работу нейросетей. Но без вмешательства человека пока итог будет не идеальным.

Нейросети очень близко подошли к редактированию фото. Еще 1-2 года и все, полностью рабочий инструмент с предсказуемым результатом