Сбер выпустил новое приложение SaluteSpeech для работы с текстом и речью.
В нём доступно две функции: распознавание и синтезирование. В первом случае программа расшифровывает речь из аудиозаписей и представляет их в текстовом формате. Во втором — озвучивает текст с возможностью настраивать паузы и ударения.
Для озвучки доступно семь голосов на русском и английском языках. Работает приложение с форматами pcm, opus, mp3, flac, alaw и mulaw.
В SaluteSpeech встроен GigaChat API, так что пользователь может загрузить короткие тезисы, из которых ИИ подготовит текст для озвучивания. Либо можно сделать краткую выжимку из готового текста.
Приложение бесплатное, но чтобы начать работу, надо подключить сервис SaluteSpeech. Его минимальная стоимость за месяц использования — 600 рублей. Есть бесплатный тариф для физлиц Freemium, по нему доступно 100 минут распознавания и 200 тысяч символов синтеза в месяц. [VC]
5 комментариев
Форум →я так понял за деньги отдают бесплатно )
Нафига козе баян?
@Alex88, под винду нет нормальных сервисов озвучки. Или унылое бормотание или ограничение в 1000 символов. Забугорные оплатить нельзя. Яндекс апи надо втыкать. А вот просто как на маке, такого не.
Бесплатный но стоит 600 руб
Попробовал фремиум. Неплохо говорит, но роботизация заметна, конечно, сильно. И еще скудный набор голосов.
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Как перезагрузить любые Apple Watch. Есть 2 рабочих способа
Как проверить, не привязан ли iPhone к какому-то оператору
Почему библиотека iTunes на Mac занимает много места
Куда уходит трафик на iPhone?
Как настроить гид-доступ на iPad?
Как на iPhone отключить новую фоновую подсветку в полноэкранном режиме YouTube
Как перезапустить зависший Touch Bar без перезагрузки MacBook
Почему селфи с iPhone получаются размытыми