Войти

Или войди с помощью

Бывший инженер OpenAI Андрей Карпатый запустил генератор нейросетей Nanochat. Свой ChatGPT можно сделать за несколько часов

Артём Баусов avatar |
Бывший инженер OpenAI Андрей Карпатый запустил генератор нейросетей Nanochat. Свой ChatGPT можно сделать за несколько часов

Бывший инженер OpenAI Андрей Карпатый представил на GitHub новый проект nanochat.

Это открытый набор инструментов, который позволяет обучить собственную языковую модель почти с нуля.

Карпатый показал, что создать свой ChatGPT-подобный бот теперь может почти любой разработчик. Nanochat включает всё необходимое: токенизатор, скрипты для обучения, код для запуска чата и даже веб-интерфейс, где можно сразу пообщаться с моделью.

Что включает проект

► Токенизатор: новая реализация на Rust

► Предварительная подготовка: корпус FineWeb для оценки CORE и других метрик

► Среднесрочное обучение; диалоги пользователя с помощником (SmolTalk), тесты и данные использования инструментов

► SFT (Supervised Fine-Tuning): проверка знаний мира, математики (GSM8K) и программирования (HumanEval)

► Обучение с использованием GRPO на задачах GSM8K

► Механизм вывода. поддерживает кэширование, инструментальные вызовы (например, интерпретатор Python), взаимодействие с CLI и WebUI в стиле ChatGPT

► Автоотчёты. система сама формирует Markdown-карточки с результатами и игровыми метриками

Чтобы обучить такую модель, понадобится сервер с восемью видеокартами Nvidia H100. На это уйдёт около 4 часов и примерно $100 при аренде оборудования в облаке. Запуск происходит командой speedrun.sh.

За 12 часов и примерно $1000 модель сможет превзойти GPT-2 по метрике CORE и способна решать базовые задачи по математике, программированию и тестам с несколькими вариантами ответов. [Habr]

18
6
1
Что-то пошло не так
4
undefined
iPhones.ru
Бывший инженер OpenAI Андрей Карпатый представил на GitHub новый проект nanochat. Это открытый набор инструментов, который позволяет обучить собственную языковую модель почти с нуля. Карпатый показал, что создать свой ChatGPT-подобный бот теперь может почти любой разработчик. Nanochat включает всё необходимое: токенизатор, скрипты для обучения, код для запуска чата и даже веб-интерфейс, где можно сразу пообщаться...

Войди и оставь комментарий

Или войди с помощью

<- Назад Забыли пароль? Войти
  1. М
    Машина Пух
    14 октябрь в 13:11
    0

    Тем временем Apple не может научить разговаривать Siri…

    Войди на сайт, чтобы ответить
    Ответить
  2. A
    An
    14 октябрь в 15:32
    0

    GPT-2 ?.. 🫠

    Войди на сайт, чтобы ответить
    Ответить
  3. J
    Joni Tri
    14 октябрь в 19:50
    2

    Сара Коннор приди

    Войди на сайт, чтобы ответить
    Ответить
  4. virtualinsanity avatar
    virtualinsanity 14 октябрь в 21:34
    0

    Писать совсем не о чем ? Одни новости про ИИ. Притомили уже с этим баловством. Реальной пользы 1-2% остальное игрульки.

    Войди на сайт, чтобы ответить
    Ответить
Помни о правилах — если начал оффтопить, то не удивляйся потом.

Нашли орфографическую ошибку в новости?

Выделите ее мышью и нажмите Ctrl+Enter.