Сколько зарабатывают люди, которые тестируют промты, и почему нейросети надо постоянно обучать

Невероятно? Но именно так и происходит у языковых моделей — нейросетей вроде ChatGPT, Gemini или GigaChat.

В нашей статье поговорим о том, что такое языковые модели, как выглядит их «школа» и в какой момент они становятся «выпускниками».

КРАТКО

◦ Вот сколько получают люди, которые тестируют промты
◦ Что такое языковые модели
◦ Почему языковые модели нужно обучать.
◦ Как обучают языковые модели
◦ ◦ Предобучение
◦ ◦ Тонкая настройка
◦ ◦ Обучение с подкреплением на основе обратной связи от человека
◦ Сколько времени уходит на создание и обучение нейросети

Вот сколько получают люди, которые тестируют промты

Пока нейросети обучаются и становятся всё лучше, пользователи тоже учатся. Они придумывают хитрые формулировки: промты, с помощью которых добиваются от нейросетей более точных ответов. И уже даже появилась новая профессия — промт-инженер, то есть, человек, который составляет запросы для нейросетей.

Как видно из скриншота, таких специалистов нанимают компании и платят им немалую зарплату. Вакансии есть и на HeadHunter, и на Finder.work. Но чтобы стать промт-инженером, нужно разбираться, что такое нейросети в целом и языковые модели в частности, а также как они устроены и как обучаются. Об этом и поговорим.

◦ Назад к содержанию ◬

Что такое языковые модели

Во вступлении мы уже упоминали определения «нейросеть» и «языковая модель», но что же это такое и в чём разница?

Искусственная нейронная сеть или сокращённо нейросеть — это вариант искусственного интеллекта. Это программа, вдохновлённая принципами работы человеческого мозга, и в этом её особенность. Конечно, она не такая сложная, как мозг, но в ней есть нейроны, которые передают друг другу информацию.

Нейроны в нейросети тоже искусственные. Они представляют собой маленькие элементы программы — математические функции. Каждый такой нейрон устроен относительно просто и умеет относительно мало. Он может только принимать информацию (естественно, выраженную в числах), а также производить запрограммированные математические вычисления по формуле и передавать результат другим нейронам.

Сила нейросети не в сложности нейронов, а в их взаимодействии. В модели могут быть миллиарды таких частичек, которые взаимодействуют между и выдают конечный результат. Также и у человека: один нейрон мало на что способен, но мы знаем, на что способен мозг.

▸ Чем отличается ИИ от нейросети. Объясним на примерах

А что же тогда такое языковая модель? Это компьютерная система, главным элементом которой (но не единственным) является нейросеть. И эта нейросеть натренирована работать именно с текстом. Она учится на огромных объёмах текстовых данных из книг, сайтов, форумов, соцсетей.

Проще говоря, языковая модель — это нейросеть, которая учится разговаривать. А если она мощная и современная, то будет называться Большой Языковой Моделью, по-английски Large Language Models или LLM.

Помимо языковых моделей, есть нейронные сети, работающие с изображениями, звуком, видео. Они учатся:

распознавать на изображениях живые объекты и предметы и рисовать их

распознавать звук и синтезировать голос

распознавать движения и синтезировать видео

Многие модели ИИ, которые изначально были только языковыми, а впоследствии приобретали новые функции.

ChatGPT записывает мой голос, чтобы потом перевести его в текст и выполнить запрос

Например, с 2023 года ChatGPT умеет работать с изображением и звуком. Можно не печатать запрос на клавиатуре, а наговорить его, или попросить модель распознать, что нарисовано на картинке, перерисовать её или нарисовать новую по текстовому запросу.

То же самое можно сказать о Gemini. В 2025 году он отлично рисует, а также распознаёт информацию с фото.

Gemini по моему запросу нарисовал реалистичную картинку

GigaChat принял мой голосовой запрос и создал реалистично изображение

GigaChat на данный момент также имеет и совершенствует все эти функции.

Если языковая модель помимо работы с текстом также работает со звуком и изображениями, она называется мультимодальной, по-английски Multimodal Models или MM.

👍 Рекомендуем

Отвечает на сложные вопросы бесплатно! Распаковал новую версию ИИ GigaChat от Сбера, который теперь рассуждает как человек

Задал четыре разных и актуальных вопроса, чтобы проверить точность и исполнительность. И оценил полезность конкретно для пользователей в России…..→

◦ Назад к содержанию ◬

Почему языковые модели нужно обучать

Когда разработчики создают языковую модель, сначала они разрабатывают её структуру. Это значит, что они решают, сколько слоёв будет в сети и сколько нейронов будет в одном слое, какую информацию будет учиться обрабатывать, каким правилам должна следовать.

Только что созданная нейросеть является пустой. Это значит, что у неё ещё нет никаких знаний и умений, это просто набор нейронов, связанных между собой и запрограммированных на определённые вычисления. И если спросить что-то у такой нейросети, она выдаст в ответ беспорядочный набор символов или ошибку, если разработчики запрограммируют эту функцию:

Примеры ответов необученной и обученной нейросети

Чтобы модель начала выдавать удовлетворительные ответы, её надо обучать на реальных данных, в случае с языковой моделью — на текстах. А удовлетворительными считаются осмысленные и логичные ответы, которые отражают знания о мире, а также соответствуют другим критериям разработчиков, например, вежливости и безопасности.

◦ Назад к содержанию ◬

Как обучают языковые модели

У каждого искусственного нейрона есть связи со множеством других нейронов, а также внутренние параметры, которые называются весами. Веса отражают важность каждой такой связи, то есть, показывают, насколько она сильна. В процессе обучения веса меняются: одни связи становятся более крепкими, а другие менее крепкими, почти как в человеческом мозге.

Обучение нейросети делится на несколько этапов:

Предобучение
Тонкая настройка
Обучение с подкреплением на основе обратной связи от человека

► Предобучение

Это примеры заданий, которые выполняет модель на этапе предобучения

Во время предобучения модели дают множество заданий, где она должна предсказать пропущенное слово.

Когда нейросеть ошибается в предсказании, она корректирует веса между нейронами так, чтобы в следующий раз предсказание было более точным. И этот процесс повторяется триллионы раз.

▸ 5 рабочих способов победить галлюцинации от нейронок

Для предобучения используют огромные базы знаний. Тексты для таких баз специально собирают, очищая от мусора: устаревших данных, повторов, рекламы, кусочков html-кода, вредной или опасной информации.

После этого этапа модель знает грамматику и синтаксис языка, а также накапливает огромный объём фактов о мире.

► Тонкая настройка

Вот примеры инструкций и эталонных ответов людей, на которые модель ориентируется во время тонкой настройки

Во время тонкой настройки разработчики учат нейросеть вести диалог и следовать инструкциям. Для этого они используют меньший, но очень качественный набор данных. Он состоит из инструкций или вопросов и эталонных ответов к ним, написанных людьми.

Нейросеть получает инструкцию, генерирует ответ, сравнивает с эталонным ответом, корректирует веса между нейронами и таким образом настраивается. При этом сами люди, создающие эталонные ответы, непосредственно с моделью не общаются. На этом этапе модель получает набор заранее созданных пар инструкций-ответов в автоматическом режиме.

К концу этого этапа нейросеть способна общаться в форме диалога и понимать намерения пользователя, а не просто продолжать текст. Также на этом этапе модель нужно делать узкоспециализированной, учить давать ответы для определённой сферы деятельности.

► Обучение с подкреплением на основе обратной связи от человека

На изображении примеры вопросов, ответов и решений людей, работающих над улучшением модели

При обучении с подкреплением модели дают запрос и просят сгенерировать несколько разных ответов. Далее эти ответы люди оценивают вручную, выбирая лучшие. Так модель понимает, какой из сгенерированных ответов наиболее предпочтителен.

▸ Почему ИИ врёт. Как появляются галлюцинации у нейросетей

К концу этого этапа модель максимально приближает стиль общения к человеческому, становится белее последовательной, безопасной и этичной.

◦ Назад к содержанию ◬

Когда обучение модели считается законченным

Модель считается готовой к выпуску, когда разработчики достигают целевых показателей по качеству и производительности:

Когда количество ошибок на этапе предварительного обучения снижается. Это означает, что модель уже извлекла из данных максимум знаний.

Когда после тонкой настройки и обучения с подкреплением модель демонстрирует высокий рейтинг по оценкам экспертов. Она стабильно выдаёт полезные, безопасные и соответствующие запросу ответы.

Когда модель успешно проходит внутренние тесты на безопасность, токсичность и соответствие фактам.

Как только эти критерии достигнуты, модель считается «выпускником» и готова работать с пользователями.

◦ Назад к содержанию ◬

Сколько времени уходит на создание и обучение нейросети

Время, необходимое для создания и обучения LLM, зависит от её размера и доступных вычислительных ресурсов.

Например, проектирование и сбор обучающей базы могут занимать несколько месяцев работы команд специалистов. И предварительное обучение тоже длится месяцами. К тому же для этого требуются тысячи специализированных графических процессоров, которые располагаются в крупных дата-центрах.

Тонкая настройка и обучение с подкреплением тоже могут занимать до нескольких месяцев, так как нужен постоянный контроль со стороны людей.

Разработчики могут потом дообучать модель, обновлять её знания или давать новые навыки. Обновление знаний и выпуск новых, улучшенных версий — это непрерывный процесс.

Итого с момента создания до выпуска модели может пройти год.

Что-то пошло не так

ChatGPT Gemini Нейросети Статьи

iPhones.ru

Представьте, что вы учите язык, но никогда не слышали, как он звучит. И даже буквы и слова никогда не видели. Но вы всё-таки научились понимать речь и отвечать собеседнику устно или письменно. Невероятно? Но именно так и происходит у языковых моделей — нейросетей вроде ChatGPT, Gemini или GigaChat. В нашей статье поговорим о том, что...