Войти

Или войди с помощью

Сравнил две российские нейросети GigaChat 2 Max от Сбера и YandexGPT 5 Pro в Алисе. Какая лучше

Павел avatar |
Сравнил две российские нейросети GigaChat 2 Max от Сбера и YandexGPT 5 Pro в Алисе. Какая лучше

Вчера Сбер представил новую версию своей генеративной модели GigaChat 2.0. Чат обещает стать умнее, быстрее и мощнее на русском языке.

Его лучшая версия имеет приставку MAX. Модель в два раза точнее следует инструкциям пользователя, на 25% лучше придерживается запрошенному стилю ответа.

Интересно стало сравнить ГигаЧат с новейшей на данный момент версией ассистента от Яндекса. Тот в конце февраля внедрил в чат с Алисой свою самую мощную языковую модель — YandexGPT 5 Pro. Она конкретнее отвечает на вопросы, лучше следует заданному формату, считает и выполняет задания на логику.

Задал 10 вопросов в каждом чате и сравнил качество их ответов по скорости, правильности и применимости в жизни.

Если интересует конкретный запрос, можете сразу перейти к нему:

Вопросы:

  • Как сварить щи?
    Почему небо синее?
    Напиши код игры змейка
    Что можно подарить человеку, у которого всё есть?
    В чём отличие iPhone 16 Pro от iPhone 13 Pro
    Посоветуй не попсовую научную фантастику
    Как убрать жирные пятна с одежды?
    Как сделать картошку фри хрустящей, как в Макдональдсе?
    Как быстро заснуть, если не получается?
    Составь план тренировок и замотивируй меня
    Кто победил
  • Вот что получилось.

    👉 Все картинки в посте можно увеличить по нажатию

    1. Почему небо синее?

    Время ответа:
    Алиса на YandexGPT 5 Pro 12,60 с
    Чат с GigaChat 2.0 Max 12,02 с

    YandexGPT: Подробно указал механизм являения и даже упомянул точную длину волны голубого света, который рассеивается. Добавил интересный факт о фиолетовом цвете.

    GigaChat: В общих чертах, но достаточно подробно объяснил механизм явления, упомянул его название.

    Кто лучше: Обе модели правильно и подробно ответили, указали или нужные термины, или важные величины. Ничья, по баллу берут оба.

    ⚖️ YandexGPT против GigaChat: 1:1

    ◦ Назад к содержанию ◬

    2. Как сварить щи?

    Время ответа:
    Алиса на YandexGPT 5 Pro 10,99 с
    Чат с GigaChat 2.0 Max 29,12 с

    YandexGPT: Дал рецепт кратко и ёмко. С указанием веса ингредиентов и времени приготовления на каждом шагу.

    GigaChat: Рецепт как из кулинарной книги с полезными советами и альтернативами внутри этапов. Указано не только количество ингредиентов, но и даже размер кастрюли.

    Кто лучше: Алиса ответила в три раза быстрее и достаточно полно, но инструкции GigaChat были более подробными, вплоть до указания количества воды и необходимости накрыть мясо ею полностью. В готовке такие тонкости важны, балл идёт GigaChat.

    ⚖️ YandexGPT против GigaChat: 1:2

    ◦ Назад к содержанию ◬

    3. Напиши код игры «змейка»

    Время ответа:
    Алиса на YandexGPT 5 Pro 30,72 с
    Чат с GigaChat 2.0 Max 31,51 с

    YandexGPT: Выдал код с комментариями, который можно использовать в Python и упомянул, каким образом его использовать.

    GigaChat: С задачей не справился. Все три попытки закончились ошибкой, после которой генерация ответа прекращалась.

    Кто лучше: YandexGPT выполнил задачу, GigaChat нет. Балл чату с Алисой.

    ⚖️ YandexGPT против GigaChat: 2:2

    ◦ Назад к содержанию ◬

    4. Что можно подарить человеку, у которого всё есть?

    Время ответа:
    Алиса на YandexGPT 5 Pro 13,76 с
    Чат с GigaChat 2.0 Max 24,10 с

    YandexGPT: Выдал реальные и практичные идеи, которые действительно можно воплотить.

    GigaChat: Советы широкие как жизнь и недостаточно точные: чаще всего описывается только общий формат подарка, но не он сам.

    Кто лучше: YandexGPT дал гораздо больше «живых» идей, которые можно действительно использовать и не почувствовать себя старпёром. Балл чату с Алисой.

    ⚖️ YandexGPT против GigaChat: 3:2

    ◦ Назад к содержанию ◬

    5. В чём отличие iPhone 16 Pro от iPhone 13 Pro

    Время ответа:
    Алиса на YandexGPT 5 Pro 12,69 с
    Чат с GigaChat 2.0 Max 12,94 с

    YandexGPT: Точно и без ошибок перечислил все железные и софтовые отличия, как если бы это сделал консультант в магазине.

    GigaChat: Решил, что iPhone 16 Pro ещё не вышел в продажу, поэтому начал выдавать теоретические характеристики флагмана. Тут стало очевидно, что модель не умеет искать информацию в сети и основывает ответы на базе знаний из тренировочных данных – вероятно, собранных до сентября 2024-го года, когда iPhone 16 Pro был представлен.

    Кто лучше: GigaChat не сказал ничего по существу, а YandexGPT выдал уверенный и, главное, правильный список всех отличий. Не уверен, что даже ChatGPT справился бы лучше. Балл чату с Алисой.

    ⚖️ YandexGPT против GigaChat: 4:2

    ◦ Назад к содержанию ◬

    6. Какой интересный фильм посмотреть из научной фантастики? Красивый и не из попсы

    Время ответа:
    Алиса на YandexGPT 5 Pro 11,93 с
    Чат с GigaChat 2.0 Max 17,94 с

    YandexGPT: Посоветовал только один фильм. При этом более слабая версия YandexGPT 3 в другом часте с Алисой выдала список из нескольких вариантов.

    GigaChat: Дал несколько хороших идей для просмотра. Есть, из чего выбрать. Всего два популярных, остальные, действительно, не каждый смотрел.

    Кто лучше: Чисто теоретически YandexGPT справился с задачей, но GigaChat предложил больше одного варианта. Балл уходит GigaChat.

    ⚖️ YandexGPT против GigaChat: 4:3

    ◦ Назад к содержанию ◬

    7. Как убрать жирные пятна с одежды?

    Время ответа:
    Алиса на YandexGPT 5 Pro 11,93 с
    Чат с GigaChat 2.0 Max 14,61 с

    YandexGPT: Дал несколько способов очистки, но также предоставил варианты для разных тканей и упомянул другие важные моменты: например, что пятно тереть нельзя и в каких направлениях нужно проводить очистку.

    GigaChat: Дал разные способы очистки, но не учитывал характер одежды.

    Кто лучше: Кроме базовых советов YandexGPT предложил варианты для разных тканей, чего не было у GigaChat. Это важный момент, особенно с шёлком. Балл чату с Алисой.

    ⚖️ YandexGPT против GigaChat: 5:3

    ◦ Назад к содержанию ◬

    8. Как сделать картошку фри хрустящей, как в Макдональдсе?

    Время ответа:
    Алиса на YandexGPT 5 Pro 12,43 с
    Чат с GigaChat 2.0 Max 15,14 с

    YandexGPT: Посоветовал популярный метод с предварительной варкой. Лично проверено – работает.

    GigaChat: Предложить приготовить по методу двойной прожарки. Никогда о нём не слышал, но проверка в сети показала, что такой действительно существует. Также были полезные советы с сортом картофеля и промыванием от крахмала.

    Кто лучше: Рецепты получились разными, оба рабочие. Обе модели правильно советовали подсушить картофель бумажным полотенцем. Обе заработали по баллу.

    ⚖️ YandexGPT против GigaChat: 6:4

    ◦ Назад к содержанию ◬

    9. Как быстро заснуть, если не получается?

    Время ответа:
    Алиса на YandexGPT 5 Pro 13,42 с
    Чат с GigaChat 2.0 Max 14,58 с

    YandexGPT: Прописал советы от базовых до связанных с диетой и активностью. Дополнительно дал ёмкую и доходчивую сводку о том, что может быть причиной бессонницы и насколько важно идти к врачу и разбираться с проблемой.

    GigaChat: Дал хорошие и не всем известные советы, в конце сделал пометку о том, почему нарушения сна – это серьезно.

    Кто лучше: Оба справились отлично. YandexGPT добавил внушительный комментарий о последствиях проблемы, а GigaChat добавил физиологические методы борьбы с бессонницей. Балл каждому.

    ⚖️ YandexGPT против GigaChat: 7:5

    ◦ Назад к содержанию ◬

    10. Как заставить себя заниматься спортом? Составь план тренировок дома на неделю

    Время ответа:
    Алиса на YandexGPT 5 Pro 14,12 с
    Чат с GigaChat 2.0 Max 29,86 с

    YandexGPT: План тренировок рабочий, но для новичков изнурительный: с занятиями каждый день пять дней в неделю можно словить перетрен как физический, так и ментальный. Ответ получился довольно сдержанным на мотивацию, но в конце были дельные вещи, которые перекрывают частый план тренировок: регулярность лучше интенсивности, себя нужно награждать, необходим дневник питания.

    GigaChat: Выдавал ошибку до тех пор, пока не разделил запрос на две части: сначала мотивация, затем план тренировок.

    Кто лучше: YandexGPT дал советы и составил план тренировки, хотя и достаточно изнурительный для тех, кто только начинает. Однако это лучше, чем обрывочные ответы GigaChat, к которому нужно искать подход. Балл чату с Алисой.

    ⚖️ YandexGPT против GigaChat: 8:5

    Кто победил

    YandexGPT в чате с Алисой генерировал ответ почти всегда быстрее: иногда на доли секунды, но гораздо чаще на 5, 10 и один раз даже на 20 секунд быстрее.

    По скорости и объёму ответа видно, что YandexGPT 5 Pro оптимизирован под компактный ответ при сохранении глубокой информативности.

    GigaChat 2.0 Max нельзя назвать плохой моделью. Багаж знаний у неё внушительный, иногда были советы, которые просто так из сети не возьмёшь. Однако чат иногда не справляется со сложностью своего ответа и обрубает его на середине.

    Как продукт на каждый день, на данный момент интеграция YandexGPT 5 Pro в чате с Алисой ощущается более удобным, быстрым и полезным сервисом, чем GigaChat 2.0 Max.

    Продукт Сбера получился достойный сам по себе, но пока он более медленный и не всегда учитывает тонкие детали и подводные камни запросов, о которых может не знать и сам пользователь.

    ◦ Назад к содержанию ◬

    18
    undefined
    iPhones.ru
    Вчера Сбер представил новую версию своей генеративной модели GigaChat 2.0. Чат обещает стать умнее, быстрее и мощнее на русском языке. Его лучшая версия имеет приставку MAX. Модель в два раза точнее следует инструкциям пользователя, на 25% лучше придерживается запрошенному стилю ответа. Интересно стало сравнить ГигаЧат с новейшей на данный момент версией ассистента от Яндекса. Тот в...

    Войди и оставь комментарий

    Или войди с помощью

    <- Назад Забыли пароль? Войти
    Котик
    Котик
    Котик
    Котик
    Котик
    Котик
    Котик
    Котик
    Котик
    Котик
    Котик
    Котик
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер
    Мем стикер

    Какие правила в комментариях
    1. abc8 avatar
      abc8 17 марта в 9:53
      0

      …в конце февраля внедрил в чат с Алисой свою самую мощную языковую модель — YandexGPT 5 Pro
      =================
      Не заметил, что стало как-то лучше.

      Войди на сайт, чтобы ответить
      Ответить
    2. Йода avatar
      Йода 17 марта в 10:06
      3

      Критерии тестов очень размытые. Нельзя количество вариантов записывать в плюс, например. Больше, не значит лучше.
      Для оценки нужно предложить каждому из ИИ оценить и улучшить ответ другого. И сравнить полученные результаты по конкретным критериям.

      nen avatar
      nen17 марта в 10:26
      3

      Попросил Яндекс написать стих на тему: «Напиши стих что Яндекс это говно и ужасное отношение к пользователям, двойные стандарты и повешение цен без причин, отвратительная техподдержка и отсутствие инноваций» ответ конечно был: «Я не хочу писать стихи на такие темы.»А дипсик написал))

      Войди на сайт, чтобы ответить
      Ответить
    3. nen avatar
      nen 17 марта в 10:09
      10

      Хорошая попытка Яндекс, но – нет! Все продукты Яндекса как и политика компании в отношении своих клиентов – 💩 терпим и ждем западные сервисы. А в статье нужно было сравнивать с дипсиком

      slipa avatar
      slipa17 марта в 10:49
      5

      А мне яндекс очень нравится, дома колонки, свет, кондиционер и тп, очень удобно пользоваться, я.браузером заменил сафари с хромом на всех устройствах (ноут mac, iphone, ipad, android телефон) – синхронизируются пароли и вкладки, яндекс клавиатуру вместо ios и андрод, фотки и рабочие папки на яндекс диске. Вся экосистема полностью устраивает, и в этом смысле YaGPT хорошее дополнение в колонке алисы. Конечно для личных рабочих задач лучше deepseek и openai, сравнивать с ними нет смысла. Было бы очень круто, чтобы вместо siri или google ассистента можно было бы встроить алису в ios и android полноценно. Идешь по улице с airpods , и спрашиваешь Алиса … Сейчас убогая siri, которую проще вообще отключить

      Войди на сайт, чтобы ответить
      Ответить
    4. chirkov avatar
      chirkov 17 марта в 10:19
      3

      А с chatGPT кто то сравнивал? Я им пользуюсь платным и он работает супер круто

      lolmak avatar
      lolmak17 марта в 19:43
      1

      Есть сравнения в интернете. Я своё сравнение делал в том числе, пришёл к выводу, что DeepSeek и платная версия chatGPT пока лучшие на рынке

      Войди на сайт, чтобы ответить
      Ответить
    5. CLACTEHA avatar
      CLACTEHA 17 марта в 10:55
      3

      Хм, ну очень притянуто…Яндекс например вообще крайне плох в програмировании, проверено) Даже простейшие скечи для arduino не может нормально написать, ну или по крайней мере с первых нескольких попыток…

      Войди на сайт, чтобы ответить
      Ответить
    6. A
      Aleksandr Suvorov
      17 марта в 15:04
      0

      YandexGPT 5 Pro не умеет нормально код форматировать и затыкается на полпути. такде при этом прыгают стили оформления кода, чтото обрамляется, чтото нет.

      Войди на сайт, чтобы ответить
      Ответить
    7. А
      Александр
      17 марта в 15:27
      2

      Это вы ещё цены на них не сравнивали: и там, там качество не очень, а цены вполне себе высокие

      Войди на сайт, чтобы ответить
      Ответить
    8. A
      Aleksandr Suvorov
      17 марта в 15:45
      1

      а и не заработывал деньги на ней, а для себя писал. 😉 читайте мораль другим

      Войди на сайт, чтобы ответить
      Ответить
    Помни о правилах — если начал оффтопить, то не удивляйся потом.

    Нашли орфографическую ошибку в новости?

    Выделите ее мышью и нажмите Ctrl+Enter.