Исследователи Apple разработали новый метод обучения больших языковых моделей (LLM). Он позволяет интегрировать как текстовую, так и визуальную информацию.
Используя разнообразный набор данных, новая модель MM1 устанавливает новый стандарт для ИИ. Нейросети смогут создавать комментарии к изображениям и давать визуальные ответы на вопросы. В компании изучают различные типы обучающих данных и архитектур моделей, что позволяет ИИ понимать и генерировать язык на основе сочетания визуальных и языковых подсказок. ИИ с помощью MM1 научится интерпретировать сложные изображения или давать ответы на вопросы, связанные с визуальными элементами.
В модели MM1 заложено 30 млрд параметров. Она может проводить многоэтапное рассуждение над несколькими изображениями с использованием подсказок «цепочки мыслей».
Это исследование является частью более широкой инициативы Apple по расширению возможностей искусственного интеллекта в условиях растущей конкуренции. Ранее Марк Гурман из Bloomberg сообщил, что Apple ведет переговоры с Google о лицензировании Gemini для реализации новых функций, которые появятся в iPhone в составе iOS 18. Также он говорил, что в iOS 18 сделают огромный упор на ИИ. [MacRumors]
7 комментариев
Форум →На данном этапе попытка сделать ИИ на айфоне это как выстрелить себе в ногу перед гонкой. Сири столько лет на облаке держали ибо дешево, а тут..жаба на облачный ИИ оставит Apple далеко позади.
@notolduser, Создание описаний фото и видео позволит искать нужные фотки. Правда, не только пользователю, но и самому Apple. Но я бы все равно заплатил за такой чип. Иногда сложно найти фотографию в архиве, а теперь будет легко.
Не зря же они нейро-ядра в свои процессоры уже несколько лет добавляют.
@anme, зря-зря-зря 🦆
Фотографии из галереи телефона они уже сканируют в поисках материалов насилия и передают в Apple (тут уже была статья на эту тему).
Теперь следующий этап. Пользователь сам заплатит за чип с механизмом анализа и созданием описания его фото и видео материалов.
Супер.
@Йода, функцию сканирования не стали использовать в итоге
@Йода, не насилия, а детского порно, и не просто “наш алгоритм считает, что это детское порно”, а “в нашей базе известного детского порно есть этот файл, мы точно знаем, что это детское порно”, и, как верно пишут выше, эту функцию так и не активировали.
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Как смотреть ролики YouTube на Apple Watch
Какой блок питания нужен для быстрой зарядки iPad
Горячие клавиши iOS для беспроводной клавиатуры
Экран iPhone X не включается, пока не завершится разговор
Почему не передаются фото с iPhone на Mac с функцией Камера Continuity
Можно ли попробовать iOS 14, а затем сделать даунгрейд на старую iOS
Что делать, если пропали треки в Apple Music
Почему во время записи экрана iPhone начинает тормозить