Apple представила новые API для преобразования речи в текст в iOS 26 и macOS Tahoe, которые работают значительно быстрее, чем аналоги. Об этом сообщил Джон Вурхис из MacStories, основываясь на результатах бета-тестирования.
Схожие функции используются для мгновенной транскрипции в приложениях, вроде Заметок, Диктофона и для записи телефонных разговоров в iOS 18.1. Однако в iOS 26 и macOS Tahoe появились SpeechAnalyzer и SpeechTranscriber, которые ускоряют обработку аудио.
По данным Вурхиса, новый инструмент Apple обработал 34-минутное видео размером 7 ГБ всего за 45 секунд с помощью командной строки Yap, созданной его сыном Финном. Это на 55% быстрее, чем у модели MacWhisper Large V3 Turbo от OpenAI, которая справилась с задачей за 1 минуту 41 секунду. Другие инструменты на базе Whisper типа VidCap (1:55) и MacWhisper Large V2 (3:55), показали ещё меньшую скорость.
Секрет успеха Apple — в обработке данных прямо на устройстве, что исключает задержки, связанные с облачными сервисами. Хотя разница во времени для одного файла может казаться небольшой, при обработке множества видео или длинных записей экономия времени становится значительной. Это особенно полезно для создания субтитров или транскрипции лекций.
Войди и оставь комментарий
Или войди с помощью
И не просит каждый раз языки скачать?
И каждый раз указать язык. Прям фантастическое удобство🤦♂️
а кто то протестил эту функцию в бетке или она у нас не работает?
Русского скорее всего нет и будет не понятно когда … если будет …
Ок, быстро, но на сколько точно?
Не понял а он видео подгрузил что ли так можно ?🫤
Секрет в iPhone
Нет, секрет в софте, который построен так, что модель крутится локально. Плюсы – скорость (это важно, если постоянно переводишь видео быстрее, чем смотришь его, напр.), минусы – тратит батарею телефона, а не мощности в облаке, работает хуже, т.к. модель локальная и размер её лимитирован.
Ну, еще плюс, если нужно секретно перевести видосик (не представляю, что это может быть, чтобы хотеть так делать – порнофильм?), и секретность важнее качества
Меня одного выкидывает с поста выше, когда пытаюсь зайти в комменты ?
Протестировал. Гораздо шустрее чем был. Русский никуда не делся
Постойте, в статье нет речи про перевод. Так же нет оценки преобразования.
Если не учитывать качество, то я готов написать самый быстрый в мире переводчик текста для видео. За одну тысячную секунды можно будет переводить многочасовые видео. Правда, текст будет всегда одинаковый, но зато какая скорость!
Рекомендуем
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.