Как превратить аудиозапись или лекцию в текст за 10 секунд и бесплатно. Спасибо нейронкам и MacWhisper

Никита Горяинов avatar | 13
FavoriteLoading В закладки
Как превратить аудиозапись или лекцию в текст за 10 секунд и бесплатно. Спасибо нейронкам и MacWhisper

Нейросети шагают по планете с пугающей скоростью. Что год назад казалось невозможным в домашних условиях и ограниченном технологическом бюджете, теперь доступно каждому бесплатно. Очередная задача, которая занимала много сил и времени, превращена в дело на 10 секунд.

Ситуация, поясняю. Вам нужно расшифровать в текст 4 часа лекции препода, запись разговора или интервью. Перепечатывать по старинке – с ума сойдёте.

Вместо этого открываем приложение MacWhisper, кидаем туда аудиофайл и через 10 секунд получаем полную расшифровку. Поддерживаются почти 50 (!) языков, включая русский. Интернет НЕ НУЖЕН. Приложение абсолютно бесплатное.

Я проверил его на нескольких лекциях с YouTube. Поражён и теперь советую всем.

Что представляет из себя MacWhisper

MacWhisper – бесплатное приложение для Mac. Вы выбираете язык, перетаскиваете туда файл и получаете полную расшифровку в двух форматах: с таймкодами и без, сплошным текстом.

Всё. Никаких «но» и прочих ограничений. Программа работает полностью в оффлайне и не «лезет» в интернет (разве что ради обновления). В списке поддерживаемых языков есть практически все существующие в мире.

Как это работает? MacWhisper использует OpenAI Whisper, запущенную в конце 2022 года. На сегодняшний день это самая быстрая и продвинутая нейросеть для перекодировки аудио в текст. Её тренировали на английском языке, а затем отмасштабировали и до поддержки других, включая русский.

Бесплатная версия MacWhisper использует уменьшенную нейромодель Whisper Tiny для моментальной транскрибции английского или стандартную модель Base для всех остальных языков. Платная версия Pro стоит 9 долларов и включает в себя модель Whisper Large – самую точную в мире по качеству распознавания речи, но более медленную. Покупать платную версию есть смысл только для тех, кто постоянно нуждается в подобных программах и не хочет терпеть даже мелкие ошибки в тексте.

Программа занимает всего 230 мегабайт и требует macOS Ventura (13.0 и новее). Она не заработает на более старых версиях ОС, увы. Вы можете также найти саму нейросеть OpenAI Whisper на просторах интернета и тогда пользоваться распознавателем на любой ОС через облачные сервисы. Просто это не так удобно, как сделано в MacWhisper: открыл, файл кинул, всё готово.

Скачать MacWhisper можно с этого сайта. Впишите в поле 0 долларов и нажмите на кнопку загрузки.

1 Звезд2 Звезды3 Звезды4 Звезды5 Звезд (20 голосов, общий рейтинг: 4.80 из 5)
🤓 Хочешь больше? Подпишись на наш Telegram.
FavoriteLoading В закладки
undefined
iPhones.ru
Нейросети шагают по планете с пугающей скоростью. Что год назад казалось невозможным в домашних условиях и ограниченном технологическом бюджете, теперь доступно каждому бесплатно. Очередная задача, которая занимала много сил и времени, превращена в дело на 10 секунд. Ситуация, поясняю. Вам нужно расшифровать в текст 4 часа лекции препода, запись разговора или интервью. Перепечатывать по старинке...
Прокомментировать

🙈 Комментарии 13

  1. scream13 avatar
    scream1323 января в 15:05
    0

    При попытке скормить ей mp3, m4a и mp4, скаченные из youtube с помощью 4K Video Downloader выдает “Could not convert audio. This format is currently not supported”. Перед скачиванием выдает лицензионный ключ, который не спрашивает и вообще непонятно куда его вводить.

    Никита Горяинов avatar
    Никита Горяинов23 января в 15:14
    2

    Ключ вводить не надо.

    А если появляется такая ошибка, переименуйте файл так, чтобы в нём не было кириллицы.

    scream13 avatar
    scream1323 января в 16:34
    0

    @Никита Горяинов, благодарю, сам не догадался поменять. Тем более у вас на скриншоте “пара по матану”.

  2. AlexWolf avatar
    AlexWolf23 января в 15:13
    0

    Вообще не качало, пока не изменил почту с .ru на .com
    Причем остальное даже не менял, выдуманная сработала (сомневаюсь, что существует ящик rambler.com)

  3. i-maikl avatar
    i-maikl23 января в 15:39
    1

    Спасибо!
    Наконец что-то полезное и не слизанное с 9to5mac на страницах айфонса )

  4. Fregat avatar
    Fregat23 января в 17:20
    1

    Win в пролете, как я понимаю…

  5. n547 avatar
    n54723 января в 18:01
    0

    Полезно, спасибо

  6. Andrey Kholodnyy avatar
    Andrey Kholodnyy23 января в 18:14
    0

    Взял зашумленную лекцию. бесплатный вариант распознавал прям с трудом. взял платную. идеально. М1 macbook pro. но долго. и греется (CPU в потолок)

    bigscrap avatar
    bigscrap23 января в 20:14
    0

    @Andrey Kholodnyy, бесплатная тоже не понравилось как распознала простое аудосообщение в телеграм

    vadim.l avatar
    vadim.l23 января в 23:39
    0

    @Andrey Kholodnyy, насколько меньше бредовых выражений?
    Запихнул в бесплатную запись телефонного разговора – транскрибация нечитаема, не угадывает слова, вместо них подходящие по звучанию словосочетания. В общем не слыша диалог в оригинале, угадать о чем была речь нереально

  7. Clifford Price avatar
    Clifford Price23 января в 20:03
    3

    Ищем на GitHub репо WhisperCPP, немного ручного труда в консоли и всё бесплатно с большой моделью.
    Под win/wine еще проще –
    nikse(.)dk – Subtitle Edit со встраиваемой поддержкой WhisperCPP или Vosk.

    Evgeny Ardonsky avatar
    Evgeny Ardonsky29 января в 8:47
    0

    @Clifford Price, могли бы вы поделиться, тем что у вас получилось под mac?

  8. martekha avatar
    martekha25 января в 4:21
    0

    “Все языки” это, конечно, сильно сказано. Их на Земле 7000+ .

Вы должны авторизоваться или зарегистрироваться для комментирования.

Нашли орфографическую ошибку в новости?

Выделите ее мышью и нажмите Ctrl+Enter.

Как установить аватар в комментариях?

Ответ вот здесь